Dodaj do ulubionych

Przyszłości szukaj w wyszukiwarce

28.12.08, 10:34
semantyka vs statystyka to bledny podzial

obecne technologie do analizy 'semantycznej' opieraja sie na statystyce,
przynajmniej te ktore rzeczywiscie dzialaja :-)

wyszukiwarki 'semantyczne' nie bede sie wiec zbytnio roznily od 'tradycyjnych'
opartych na wspolwystepowaniu slow; ich indeksy bede jedynie wzbogacone o
wyzszy poziom abstrakcji (np. oprocz slow, typy obiektow do ktorych sie
odnosza: 'apple'->'owoc' vs 'apple'->'firma' i kategorie: 'apple'->'jedzenie'
vs 'apple'->'elektronika'); bedzie to rowniez wymagalo nieco bardziej
skomplikowanych algorytmow do przetwazania tych informacji, oczywiscie
algorytmow statystycznych

nie ma wiec mowy o rewolucji - to bedzie ewolucja, ktora ma miejsce juz od dawna
Obserwuj wątek
    • bartopry Przyszłości szukaj w wyszukiwarce 28.12.08, 10:43
      Ocho....zaczyna się....czerwoni po zdominowaniu prasy, tv, radia dobierają się do sieci (ostatniego w pełni niezaleznego systemu wymiany informacji). Nie myślałem, że to nastąpi aż tak szybko, zaraz autorke tego tekstu uzna się za jakąś wielką wyrocznie, sam tekst za przełomowy i jazda do cenzury. Politycy pod płaszczykiem walki z terroryzmem, pedofilami i niską jakością informacji w sieci zaraz stworzą urzędy i prawo regulujące działanie w sieci....
      • krasnov Ten cały tekst to paplanie i autoreklama 05.01.09, 17:36
        Dobitne podsumowanie tych pierdół, dokonane przez znajomego, bo mnie się aż pisać nie chce:
        my.opera.com/Jurgi/blog/2009/01/05/kto-googla-pod-latarnia
        • asterekpl Re: Ten cały tekst to paplanie i autoreklama 14.01.09, 15:01
          Hehe, Hakia na postawioną przez nią samą (że spersonifikuję maszynę) tezę: "It
          takes about 2.7 liters of water to make 1 liter of coke" znajduje między innymi
          przepis na "bombę sodową/gaz trujący" ze strony
          members.fortunecity.com/shdaow101/anachy/bomb/bombs.html.
      • pierwszarandkawsaunie specjalist od inteligencji żywej i Logiki skupione 06.01.09, 00:11
        "specjalist od sztucznej inteligencji, logiki rozmytej"
        ..rzeczywiscie rozmyta ta logika.
        A ja jestem specjalist od inteligencji NATURALNEJ i LOGIKI SKONDENSOWANEJ i powiem tyle:

        1. To nie ma znaczenia, bo 99% populacji to i i tak analfabeci.

        2. Nowe rozwiązanie bedą miały nowe efekty uboczne. Powstaną Nowe, innego rodzaju absurdy. Chętnie je pokontempluję.

        3. Ostatnio pomału drobnymi Quantami dociera do mnie, iż jest prawdopodobne, że google niebawem będzie dostarczało JAKOŚCIOWE wyszukania. Ale wciążjestm sceptykiem.

        4. odnośnie pkt.1. Ludzie posługujący się sprawnie mową i pismem, i czytający niby ze zrozumieniem >> to KOMPLETNI ANALFABECI.
        odkryłem to 2-3 lata temu. To niewiarygodne.
        Jednak FAKT.

        Patrzą na SŁOWO i myślą że jest zupełnie czymś innym niż jest.

        Chodzi mi o to że oprócz znaczeń, które każdy sam słowom nadaje, mają one także znaczenia SWOJE Autonomiczne (Sam-O-istne),(SelfKrąg`iewne) o potencjale GRAVITACYJNYM. niezależnie, jak przywykliśmy je używać, czy jakie znaczenia im nadawać.
        • a123469 Re: specjalist od inteligencji żywej i Logiki sku 14.01.09, 17:59
          Te Twoje procenty są naprawdę skondensowane i ścisłe.
    • fliegendeholaenderin Przyszłości szukaj w wyszukiwarce 28.12.08, 11:29
      A skąd ona wie, że "bill" ma 15 znaczeń, a nie na przykład 7 albo 19? Hakia z
      wyszukiwania "bill" daje tak samo nieprzydatne wyniki, jak ggl, ma tylko
      brzydszy interface i obrazek z podlinkowaną głupawą ciekawostką.
      • lehoo Re: Przyszłości szukaj w wyszukiwarce 28.12.08, 15:02
        Wypisała sobie ołówkiem na kawałku papier, a potem policzyła. Wyszło 15. Ot, i
        masz odpowiedź na pytanie.
      • solardragon Re: Przyszłości szukaj w wyszukiwarce 29.12.08, 17:29
        to ile znaczeń ma dane słowo definiuje, jeśli sie nie mylę - ontologia.
        Jest swego rodzaju słownikiem znaczeń i relacji logicznych na możliwie
        najniższym poziomie znaczeniowym.

        Pierwsza szeroko znana ontologia nazywała się CYC - potem powstała dostępna dla
        wszystkich OpenCYC.

        Sama kwestia 'usemantycznienia' internetu to zadanie dość czasochłonne i nie
        takie proste. Przede wszystkim brak ontologii POLSKOJĘZYCZNEJ - od tego trzeba
        by zacząć by robić 'polski internet semantyczny'.
        Jeśli są zapaleńcy interesujący się tematem to zapraszam do komunikacji.


        -----------------------------------------
        www.slodkiezycie.pl -
        portal społecznościowy dla CUKRZYKÓW, ich rodzin i LEKARZY DIABETOLOGÓW
        • komandor_gruzel Re: Przyszłości szukaj w wyszukiwarce 31.12.08, 14:00
          Nie trzeba. Wystarczy ustanowić predykat same-as dla np. słów jabłko i apple i
          już można korzystać z logiki opisowej dla obiektów jabłko tak samo jak dla
          obiektów apple.
          • a123469 Re: Przyszłości szukaj w wyszukiwarce 14.01.09, 17:25
            Tak, a "zamek błyskawiczny" to będzie "lightning castle". ;]

            Niestety, rózne jezyki nie sa do końca przetłumaczalne i występują spore różnice w znaczeniu słów. W jednym języku jakieś słowo może mieć nie pokrywajacy się w pełni zbiór znaczeń z jego analogią w innym. Istnieje wiele słów w ogóle nieprzetłumaczalnych w prosty sposób. (dzieje się tak całkiem często) W przypadku wyszukiwania będzie powodowało to irytujące nieporozumienia, co spowoduje szybki powrót do Google-a.
      • vaterunser Re: Przyszłości szukaj w wyszukiwarce 30.12.08, 01:15
        Nie ona tylko on Riza Berkan jest mezczyzna. Poszukaj w Googlu, to znajdziesz. A
        tu masz link; tam tez jest jego zdjecie. Wcale kobieco nie wyglada.
        • vaterunser Re: Przyszłości szukaj w wyszukiwarce 30.12.08, 01:18
          Tu ten obiecany link:
          www.project-syndicate.org/commentary/berkan1/German
    • fliegendeholaenderin Re: Przyszłości szukaj w wyszukiwarce 28.12.08, 11:36
      To są ciągle dość naiwne metody, dające bardzo dużo wyników przypadkowych i to
      chyba nie tylko dlatego, że bierze się bardzo prymitywne ontologie i wąskie
      konteksty.
      • pixelrat Re: Przyszłości szukaj w wyszukiwarce 28.12.08, 12:05
        hehe, dokladnie, ja tez mam obawy. a moze po prostu nie zrozumialem
        tekstu? :/

        a tak w ogole to wpiszcie w hakii i google'u: "how many people live
        in chicago?"

        no ile? :)
      • zezowaty_cyklop Re: Przyszłości szukaj w wyszukiwarce 29.12.08, 09:50
        "Zbudowanie ontologii obejmującej całą wiedzę świata jest ogromnym
        przedsięwzięciem wymagającym kompetencji i wysiłku porównywalnego z
        tym, jakiego wymaga stworzenie wielotomowej encyklopedii."

        Śmiem twierdzić, że stworzenie wielotomowej encyklopedii to pikuś
        przy budowaniu ontologii obejmującej "całą wiedzę świata". Nawet
        jeśli mrugniemy okiem przy słowie "całą" to i tak encyklopedia będzie
        tylko podzbiorem informacji i struktur, które trzeba zgromadzić PRZED
        przystąpieniem do budowania tej ontologii.
      • lahdaan Potrzeba humanistycznej informatyki 29.12.08, 11:19
        Chyba, że ktoś zbuduje szkielet (zasady wyszukiwania), a sami internauci będą
        wypełniać go treścią... Poza tym istnieje jeszcze kierunki kognitywne
        językoznastwa, antropologii i in. ale tu już nie wystarczą cyferki i wzory.
        Potrzeba humanistycznej informatyki.
    • martin.slenderlink Poetic spam 28.12.08, 13:42
      "Kiedy komputery osiągną semantyczną precyzję w obsłudze języków naturalnych" - pomarzyć można, tak samo jak w przypadku zgromadzenia całej wiedzy o świecie, czysta utopia. Szukanie jest możliwe tylko w kontekście, a kontekst jako taki zna tylko dana grupa ludzi, nie komputer, czy wyszukiwarka. Człowiek oczywiście może precyzyjnie wykorzystywać narzędzia i konteksty sobie szybciej za ich pomocą przekazywać, ale logika rozmyta czy rewolucja semantyczna ze stogu siana igły nie wydobędą.

      Voila: accurapid.com/journal/15mt.htm
      Niezły tekst, poświęcony trochę innemu problemowi, ale chodzi mi o zawarty tamże punkt 3, czyli common sense.
    • ereta Przyszłości szukaj##### Księgarnia czy biblioteka? 28.12.08, 13:46
      Twardy dysk zawiera księgarnię z 60 tys tytułów, czy raczej
      bibliotekę z 60 tys tytułów. Tłumacz, jak tam było?
      • vaterunser Re: Przyszłości szukaj##### Księgarnia czy biblio 30.12.08, 01:12
        W tekscie niemieckim jest Buchhandlung, czyli ksiegarnia. Czemu nie?
        • vaterunser Re: Przyszłości szukaj##### Księgarnia czy biblio 30.12.08, 01:22
          A po angielsku jest bookstory, czyli tez.
    • comrade W necie NIE MA wartościowych informacji 28.12.08, 16:37
      Przez googla nie znajdziecie żadnej informacji gospodarczej np. spróbujcie
      znaleźć wydobycie węgla w PL w okresie 1980-2008. Roczniki statystyczne są -
      owszem - ale płatne. W ogóle - każda strona która ma jakieś wartościowe
      informacje każe sobie za dostęp do nich płacić. Google jest jedynie witryną
      indeksującą strony, wyszukiwarką wskaźników do informacji a nie samych informacji.
      • pixelrat Re: W necie NIE MA wartościowych informacji 28.12.08, 21:20
        A to nieprawda - mozna znalezc informacje o wydobyciu wegla w
        poszczegolnych latach np. w 1980 - ponad 160 mln ton, a w 2007 -
        87,2 mln ton. :) wystarczy tylk oposzukac. Ja w kilka klikow
        znalazlem dosyc sporo informacji :)

        nikt nie powiedzial, ze google jest wyszukiwarka darmowych
        informacji...

        "wyszukiwarką wskaźników do informacji". ugh, ale o co Ci chodzi???
    • brunoski Przyszłości szukaj w wyszukiwarce 29.12.08, 08:44
      chcialbym podkreslic, ze 'wiecej racji' niz autorka maja
      komemntatorzy, w dodatku w odniesieniu do rzeczy oczywistych, why is
      she being syndicated?

      "obecne technologie do analizy 'semantycznej' opieraja sie na
      statystyce,
      przynajmniej te ktore rzeczywiscie dzialaja :- "

      ""Kiedy komputery osiągną semantyczną precyzję w obsłudze języków
      naturalnych" - pomarzyć można, tak samo jak w przypadku zgromadzenia
      całej wiedzy o świecie, czysta utopia. "

      ::: w obu przypadkach - jedynie sensowne, okaze sie, czy przydatne -
      wydaje sie podejscie von Ahna
      video.google.com/videoplay?docid=-8246463980976635143
    • jabo23 Hakia jest żałośnie bezradna 29.12.08, 10:44
      Googlowi do pięt nie dorasta. Na proste pytanie "speed of light" na
      pierwszym niejscu jest oczywiście wikipedia (to każdy głupi wie, bez
      żadnej wyszukiwarki). Następne odnośniki - bez głębszego związku z
      tematem. Na podobne pytanie (zadane w języku polskim) Google
      wprawdzie też kieruje do Wikipedii, ale właściwa liczba pojawia się
      już w pierszej odpowiedzi. Na dodatek wszystkie odnośniki na
      pierwszej stronie mają związek z tematem zapytania.
      Niby niewiele, a jednak ;-)
      • solardragon Re: Hakia jest żałośnie bezradna 29.12.08, 17:34
        zdaje się, że jakiś rok po tym jak PROKOM wszedł w ten projekt, ostatecznie
        praktycznie jego rozwój wydaje się być 'niepośpieszny'
        Z czego to wynika? nie wiem - wiem, że P wsadzał ta właśnie jakieś swoje
        rozwiązania do analizy semantycznej.


        -----------------------------------------
        www.slodkiezycie.pl -
        portal społecznościowy dla CUKRZYKÓW, ich rodzin i LEKARZY DIABETOLOGÓW
    • czerwonasukienka1 Przyszłości nie szukaj w googlu 29.12.08, 18:18
      przeciez wystarczy dodac do frazy "kill bill" fraze "+film" i mamy co chcemy.
      A co do pozycjonowania coz wszyscy sie wypozycjonuja i google dalej bedzie
      rozrozniac wartosciowe strony od tych mniej.
      • vaterunser Re: Przyszłości nie szukaj w googlu 30.12.08, 01:26
        Nie wszyscy sie wypozycjonuja, bo sporo kosztuje.
      • a123469 Re: Przyszłości nie szukaj w googlu 14.01.09, 17:39
        Faktem jest, że prosty Google jest lepszy niż te wszystkie semantyczne kombinacje i nieprędko się to zmieni. Pobicie Google bez ogromnych nakładow finansowych jest niemożliwe. Taka wyszukiwarka musiałaby mieć wiecej zaindeksowanych stron i efektywnieszy algorytm szukania, a w Googlu efektywność i tak jest wysoka. Właściwie to podejrzewam, że nawet ewentulana poprawa nie byłaby tak wielka, żeby zmienić przyzwyczajenia Internautów. Przyszłość raczej należy do Google.
        • a123469 Re: Przyszłości nie szukaj w googlu 14.01.09, 17:43
          Akurat wielką zaletą algorytmu "statystycznego" jest to, że prawie zawsze większość ludzi znajdzie to co chce. Tzw. "semantyczny" moze i będzie skuteczniejszy na papeirze, ale i tak nie będzie to zauważalne dla większości - czyli nie przełoży się na popularność.
    • jarek.do Google zaśmiecarką? 30.12.08, 02:52
      Krytyka googla - zaśmiecarki, a nie wyszukiwarki internetowej - jak
      najbardziej uzasadniona. Niestety projekt rewolucji semantyczej
      (która też od dawna mi się marzyła) - może się okazać utopią. Z
      zajęć uniwersyteckich z teorii mnogości, z filozofii formalnej i
      algebry uniwersalnej i z lektur z filozofii matematyki pamietam
      konkluzję z prac Goedla o niemozliwości sformalizowania (w sensie
      logicznym) języka naturalnego. Jeśli tak to algorytmizacja
      semantyczna nie jest możliwa. Logika jest ślepa na znaczenie słów,
      zajmuje się tylko strukturami i formą ich łaczenia. Ponadto
      kontekstowość języka nie może zostać w pełni opisana nawet
      leksykograficznie a cóż dopiero w postaci "rozumiejącego" algorytmu.
      Czy logiki modalne i fuzzy logic zmierzyły się z tym problemem?
      • brunoski Re: Google zaśmiecarką? 31.12.08, 04:33
        @jarek.do
        przeceniasz Godla twierdzenie, spojnosc systemu nie jest konieczna
        do rozumienia jezyka, wszyscy w glowie mamy sprzecznosci
        i radzimy sobie swietnie :)
      • komandor_gruzel Re: Google zaśmiecarką? 31.12.08, 14:11
        Na szczęście wyszukiwarka semantyczna również nie musi być idealna. Wystarczy,
        żeby była zadawalająco dobra. Np. niech prezentuje tylko kontekst prawny frazy
        "kill the bill" i niech rozumie numer paragrafu lub nazwę ustawy.
        Poza tym, taka wyszukiwarka wcale nie musi działać tak jak Google - jedna dziura
        na szukany tekst. To może być formularz adaptujący się do wpisywanej frazy. Np.
        wpisujesz "kill the bill" i pojawiają Ci się dodatkowe pola "act name", "issue
        date", "backed by" oraz ew. przycisk "Not a code of law" do szukania w innym
        kontekście. W backendzie siedziałby prosty tłumacz, który przekładałby pola
        formularza na składnię SPARQL.
      • lucky81 Re: Google zaśmiecarką? 14.01.09, 19:28
        Twierdzenia Goedla nic nie mówią o żadnym języku naturalnym. To są twierdzenia
        matematyczne, nie lingwistyczne.

Nie masz jeszcze konta? Zarejestruj się


Nakarm Pajacyka