Dodaj do ulubionych

PROBLEM! - tworzenie listy słów

IP: *.crowley.pl 16.11.04, 18:25
czy jest jakis program ktory potrafi z zadanego tekstu (format Word lub txt) stworzyc liste słów pod względem częstotliwości ich wystepowania? Bardzo proszę o odpowiedź.
Obserwuj wątek
    • Gość: pollak Re: PROBLEM! - tworzenie listy słów IP: *.internetdsl.tpnet.pl 16.11.04, 21:29
      W Perlu można sobie szybko napisać.
      • Gość: bolo Nie napiszę :( nie jestem informatykiem.... IP: *.crowley.pl 16.11.04, 21:53
        jestem tylko zwykłym użytkownikiem. nie jestem w stanie napisać programu ani w Perlu ani w czymś innym.
        może sa gotowe programy bądź nakładki na MS Office?
        Proszę o pomoc.
    • Gość: 10-13-33 Re: PROBLEM! - tworzenie listy słów IP: 5.2.* / *.chello.pl 16.11.04, 22:56
      odezwij sie i upomnij madtroll@o2.pl jak bede mial chwile moge i cos takiego
      zrobic (przynajmniej sprobuje) tylko pod jaki system?
      • Gość: bolo system? Windows -95 IP: *.crowley.pl 17.11.04, 11:48
    • mika_p Re: PROBLEM! - tworzenie listy słów 17.11.04, 00:59
      Wiesz co... kilka tygodni temu był podobny wątek, nie mogę go teraz znaleźć
      przez wyszukiwarkę, bo trochę za wolno mi wszystko chodzi, ale coś tam było o
      pliku tekstowym, o excelu chyba i w jakiejś formie uzyte wyrazenie "lista
      słów", może "lista wyrazów", i chyba nawet podane było rozwiązanie problemu -
      poszukaj sobie.
      • Gość: bolo Re: PROBLEM! - tworzenie listy słów-owszem.. IP: *.crowley.pl 17.11.04, 11:48
        tak to ja pisalem. Ale wówczas chodziło mi o ekstrakcję słów z tekstu do tabeli jednokolumnowej.
        Teraz problem jest poważniejszy - ile razy dane słowo pojawiło sie w tekście. Albo inaczej - ranking występowania słów.
    • Gość: sMart Re: PROBLEM! - tworzenie listy słów IP: *.wiromet.com.pl / *.wiromet.com.pl 17.11.04, 12:12
      Nie jestem expertem w dziedzinie programowania, ale osobiście przekleiłbym cały
      tekst do pliku tekstowe, po czym za pomocą Excela, a własciwie platformy VBA,
      wyciągnał z pliku wszystkie wyrazy tworząc gotową statystykę w arkuszu Excela.

      Jeżeli znajdę chwilkę, to pomyślę nad tym. Napisz jednak, jakiego masz
      Office'a, bo ma to znaczenia dla programowania w VBA.

      Pozdrawiam
      • Gość: bolo jaki Office? IP: *.crowley.pl 18.11.04, 14:17
        mam Office 97
    • user0001 Re: PROBLEM! - tworzenie listy słów 17.11.04, 14:42
      Ale ci windowsowcy mają problemy...

      Pod prawdziwym systemem operacyjnym robimy to tak:

      cat plik.txt | tr -d -c '[:alpha:][:space:]' | tr '[:blank:]' '\n' | tr -s '\n'
      | tr '[:upper:]' '[:lower:]' | sort | uniq -c | sort -n > wynik.txt

      Można też napisać program (python, perl lub coś innego), ale takiego pipe piszę
      się "z pamięci".

      Pod Windowsem cygwin.com by pewnie umiał to obsłużyć, tylko nie wiem czy
      dobrze zinterpretuje polskie znaki.
      • Gość: bolo być może ale to z moim problemem :( IP: *.crowley.pl 18.11.04, 18:50
        mam już tą windozę i nie przesiąde sie raczej na Linuxa. nie udało mi się go zainstalować a poza tym nie akceptuje mojej karty graficznej i muzycznej.
        Tak więc mam widnowsa i może mimo wszystko może znacie jakieś rozwiązanie mojego problemu?

        przypominam problem:
        chodzi o sporządzenie rankingu częstotliwości występowania słów w pliku w formacie np. Worda lub txt.
        czyli inaczej mówiąc chodzi o sporządzenie listy najczęściej używanych słów.
        TEKST NIE MUSI AKCEPTOWAĆ POLSKICH LITER!

        pozdrawiam i proszę pomóżcie.
        • pollak Re: być może ale to z moim problemem :( 19.11.04, 10:23
          #!/usr/bin/perl
          use strict;
          use warnings;
          use locale;
          my %slowa;
          my $plik_we = shift || 'nazwa_pliku.';
          open WE, $plik_we or die "nie mozna otworzyc `$plik_we': $!\n";
          while(<WE>){chomp; ++$slowa{$&}while(/(\w+)/g);}
          close WE;
          map {print"$_ -> $slowa{$_}\n"} reverse sort{$slowa{$a} <=> $slowa{$b}}
          keys %slowa;



          Masz powyższe w Perlu. Nie uruchamiałem (jestem w pracy), ale sądzę że ma jedną
          zaletę. Po zainstalowaniu ActivePerla (za darmo), powinno działać pod każdymi
          Windowsami. Druga zaleta, że można to spokojnie rozbudowywać (poprawić warunek
          na "definicję" słowa) itp. Program tworzy listę słów w pamięci (właściwie hasza
          nie listę). Nie powinno być też problemu z polskimi znakami, wielkie i małe
          litery są rozróżniane, ale można to wyłączyć dodając jeden znak do kodu.
          ActivePerl instaluje się bez problemu (deinstaluje także). A jeśli kombinujesz z
          plikami, to może Ci się przydać. Jeśli jesteś zdesperowany, to spróbuj. W razie
          czego daj znać.
    • Gość: Beny powiem tak IP: .1.* / 195.127.197.* 19.11.04, 10:56
      Strasznie sie palujecie z tym windowsem. Takie madre glowy, ale zagooglac to nie
      byly laskawe. Prosze oto program ktorego szukales:
      www.adwt.com/pub/wurdz.exe Ten sprawdzilem i dziala zgodnie z zyczeniem.

      A dodatkowo np.
      www.handyarchive.com/Home-Education/Literature/11733-Word-Sorter.html
      lub tak dla wprawy: tinyurl.com/4pegb
      itd.
      • Gość: pollak Re: powiem tak IP: *.internetdsl.tpnet.pl 19.11.04, 20:17
        Eeeetam, własnego skrypta można dowolnie dopieszczać, a założyciel wątku jest
        tutaj już drugi raz z tego typu problemem. Za trzecim wystarczy dodawać nowe
        ficzery no i cieszyć się, że ... zrobiłem to sam lub prawie sam (banalna rzecz
        a cieszy).

        (ten wurdz.exe, aż ok. 2 mega, tyle co zainstalowałem i widzę że jest problem z
        polskimi znakami, a ten drugi chce jakiegoś .NET czy czegośtam ;))
      • Gość: bolo Beny !! SUPEREK !! IP: *.crowley.pl 19.11.04, 22:50
        gościu ! jesteś OK! dziękuję !!!
Inne wątki na temat:

Nie masz jeszcze konta? Zarejestruj się


Nakarm Pajacyka