Dodaj do ulubionych

Alpha Go Zero

20.10.17, 02:48
Gra go była dotychczas wyzwaniem dla sztucznych inteligencji. Jest trudniejsza od szachów, dopiero w zeszłym roku Program Alpha Go pokonał arcymistrza.
Lecz tamten program korzystał z wiedzy i doświadczenia człowieka, w trakcie nauki rozgrywając partie z amatorami i mistrzami. Nowa wersja, Alpha Go Zero, znała jedynie reguły gry, startowała jako "tabula rasa" i nabywała wiedzy i doświadczenia rozgrywając partie wyłącznie sama ze sobą. Po 3 dobach wygrała z tamtą wersją w 100 meczach na 100.
To spektakularne osiągnięcie opisano w "Nature".
www.nature.com/nature/journal/v550/n7676/full/nature24270.html
Obserwuj wątek
    • cojestdoktorku Re: Alpha Go Zero 20.10.17, 14:05
      powinno sie teraz temu algorytmowi dać wyniki wszystkich naszych eksperymentów i niech odkryje fizykę od zera
      • majka_monacka Re: Alpha Go Zero 20.10.17, 21:12
        cojestdoktorku napisał:

        > powinno sie teraz temu algorytmowi dać wyniki wszystkich naszych eksperymentów
        > i niech odkryje fizykę od zera.

        Nie odkryje, ponieważ uczenie we wzmocnieniem (reinforcement learning) jest skuteczne, kiedy środowisko jest dobrze zdefiniowane stałymi regułami. Pisałam już wielokrotnie, ze w dynamicznie zmiennym i złożonym srodowisku, którego nie da się opisać zamknietym zbiorem reguł stosowac trzeba uczenie motywowane (motivated learning), ktore daje zdolnośc tworzenia emocji i wyznaczania własnych celów i reguł. Tu polecam prace Starzyka, ktory wynalazł ten typ uczenia. Np. J. A. Starzyk, J. Graham, L. Puzio, “Needs, Pains, and Motivations in a Simulated Learning Agent,” IEEE Trans on Neural Networks and Learning Systems, vol. 28, no.11, Nov. 2017, pp. 2528-2540.
        • andrew.wader Re: Cel: terraformacja galaktyki 05.11.17, 21:25
          majka_monacka napisała:

          > Nie odkryje, ponieważ uczenie we wzmocnieniem (reinforcement learning) jest sku
          > teczne, kiedy środowisko jest dobrze zdefiniowane stałymi regułami. Pisałam już
          > wielokrotnie, ze w dynamicznie zmiennym i złożonym srodowisku, którego nie da
          > się opisać zamknietym zbiorem reguł stosowac trzeba uczenie motywowane (motivat
          > ed learning), ktore daje zdolnośc tworzenia emocji i wyznaczania własnych celów
          > i reguł. Tu polecam prace Starzyka, ktory wynalazł ten typ uczenia. Np. J. A.
          > Starzyk, J. Graham, L. Puzio, “Needs, Pains, and Motivations in a Simulated Lea
          > rning Agent,” IEEE Trans on Neural Networks and Learning Systems, vol. 28, no.1
          > 1, Nov. 2017, pp. 2528-2540.

          Powstaje problem, czy rzeczywiście autentyczny, szybki rozwój A.I. wymaga wpierw "utworzenia tzw. agentów", którzy są obdarzeni emocjami i motywacjami. Daleka jest jeszcze droga do takich androidów.. Trzeba by było jednak znacznie lepiej rozumieć działanie mózgu..

          Ale proces, być może potoczy się inną drogą ..

          W dzisiejszej Gazecie Wyborczej pod

          wyborcza.pl/magazyn/7,124059,22602608,youtuberzy-ostatni-artysci-jacek-dukaj-opowiada-o-sztuce-w.html
          jest ciekawy wywód na ten temat .. (spisał Jacek Dukaj)

          [" Kto komponuje dla Homo sapiens program wy-dobywania prawd natury i ziszczania ich przez technologię? Nie są to politycy. Nie są to filozofowie. Nie są to artyści. To przedsiębiorcy-wizjonerzy pokroju Siergieja Brina i Larry’ego Page’a, Elona Muska, Billa Gatesa, Jeffa Bezosa, Marka Zuckerberga, Andy’ego Rubina czy anonimowego twórcy algorytmu blockchain. A oni nie są żadnymi neutralnymi, „naturalnymi” causae efficiens – niemal bez wyjątku powodują nimi bardzo silne, konkretne przekonania ideowe, wręcz metafizyczne.

          Celem założycieli Google’a jest transcendencja Homo sapiens dzięki sztucznej inteligencji; wyszukiwarka internetowa to jedynie worek treningowy AI. Celem Muska jest wyprowadzenie człowieka jako gatunku poza Ziemię i „terraformacja galaktyki”; Tesla, SpaceX, SolarCity etc. to tylko środki, etapy pośrednie. Celem Zuckerberga jest organiczne zrośnięcie realu z wirtualem i zmiana wszelkich systemów rządów i relacji międzyludzkich w świecie materialnym na wzór tych sieciowych. Celem technologii blockchain (kryptowalut, Ethereum etc.) jest eksternalizacja zaufania i eliminacja jako zbędnych – ludzkich instytucji-gwarantów: rządów, banków, prawa. Itd., itp.

          Owe wybory technologiczne – te ścieżki przyczyn i skutków – kształtują nasz świat. A zatem nasz lifestyle. A zatem naszą kulturę. A zatem nas samych.

          Nie tylko nie są one logicznie konieczne, tak jak konieczne w geometrii euklidesowej jest odkrycie prawa Pitagorasa. Nie są nawet logicznie ze sobą spójne. Na przykład ścieżki realizowanej przez Muska nie da się ostatecznie pogodzić ze ścieżką Brina i Page’a, jako że transcendencja człowieka w Cyfrę obraca w absurd projekty biologicznej kolonizacji kosmosu.

          Jak współcześnie mierzy się w kulturze i polityce „postęp”? Realizacją nowych wartości etycznych i estetycznych, narzucanych zrazu przez zmiany naszego trybu życia, potem trybu myślenia, potem trybu odczuwania. Trzeba sobie uświadomić, że w praktyce bycie postępowcem, progresistą oznacza bycie niewolnikiem celowości założonych przez Brina, Muska, Zuckerberga, Bezosa et consortes; i więcej: oznacza głośną pochwałę swej niewoli.

          Według jakiej bowiem miary wartości można oceniać zmiany wartości?

          Postęp pracuje nie tyle metodą faktów dokonanych, ile dokonanych przewartościowań.

          Ale to jest opis rzeczywistości sprzed czasów sztucznej inteligencji. To była nadal „niewola humanistyczna”. (I nawet nie wiedzieliśmy, że jesteśmy w rękach humanistów).

          A teraz usuńmy z tych procesów człowieka jako podmiot. Wejrzyjmy za ostatnią zasłonę alethei: to nie Zuckerberg używa Facebooka dla swoich celów – to Facebook używa Zuckerberga. To nie Brin używa Google’a – to Google używa Brina. I nie kryje się za tym złowroga inteligencja i intencja AI – to sam logos, sama mapa ścieżek bytu determinuje kształt człowieczeństwa nieauratycznego. Technologia jest twórcą wartości. W tym – wartości estetycznych.

          Rzecz bowiem nie w physis, nie w poszczególnych odkryciach informatyki i chemii. Pytamy tu o tę morfologię przyczynowości, która sprawia, że jakakolwiek przyczyna dochodzi jakiegokolwiek skutku. A świadomość człowieka może – ale NIE MUSI – stanowić jedną ze składowych kauzalnych..."]

          No tak, jeśli ktoś cały czas opowiada się za bezcelowością działania ewolucji.. to chyba łato mu się zgodzić z wywodem j. Dukaja. ~ Andrew Wader
        • cojestdoktorku Re: Alpha Go Zero 21.02.18, 12:15
          >Nie odkryje, ponieważ uczenie we wzmocnieniem (reinforcement learning) jest skuteczne, kiedy środowisko jest dobrze >zdefiniowane stałymi regułami.

          nasze środowisko jest bardzo dobrze zdefiniowane stałymi regułami które nazywamy prawami fizyki
          ta pozorna komplikacja z która się wszyscy stykamy jest tylko nadbudową i przemieszaniem tych praw

          gra w "go" tez wydaje nam sie skomplikowana ale kieruje nią kilka podstawowych zasad "prawa fizyki go"
          wszystkie możliwe kombinacje w tej grze są tylko nadbudową dla tych kilku zasad
          kombinacji w grze w "go" jest 10^761, dla porównania ilosc atomów we wszechświecie ocenia sie na 10^80 (wazne by pamietac ze 10^81 to 10 razy więcej od 10^80)
          skoro nieświadoma maszyna poradziła sobie w takim gąszczu możliwości "go" i wybrała te optymalne rozwiazania (optymalne w porównaniu z nami) to nie widzę powodu by jakas nieświadoma maszyna w przyszłosci nie wybrała o wiele bardziej optymalnych rozwiązań niż nasze ale nie w grze w "go" tylko w grze "atomami" prowadzonej w naszym wszechświecie





          • europitek Re: Alpha Go Zero 22.02.18, 03:03
            cojestdoktorku napisał:
            > dać wyniki wszystkich naszych eksperymentów i niech
            > odkryje fizykę od zera

            > nasze środowisko jest bardzo dobrze zdefiniowane stałymi regułami
            > które nazywamy prawami fizyki

            Jeśli chcesz odkrywać fizykę "od zera" to nie masz żadnych reguł początkowych wyznaczających jakiekolwiek ograniczenia. W eksperymencie z go było ograniczenie w postaci jawnych reguł formalnych tej gry.
    • cojestdoktorku Re: Alpha Go Zero 02.01.18, 18:56
      www.komputerswiat.pl/opinie/trendy-technologiczne/2017/10/alphago-zero-czyli-o-krok-blizej-osobliwosci.aspx
      • cojestdoktorku Re: Alpha Go Zero 02.01.18, 19:00
        komentarz pod artykułem:
        "Nie wiem czy jestesmy tak daleko od osobliwosci. To co stworzyli naukowcy teraz to algorytm ktory potrafi pisac i ulepszac inny algorytm (algorytm gry w Go). Wystarczy teraz skierowac go na siebie samego i powiedziec zeby samemu siebie poprawil. Mozemy nawet nie wiedziec na czym bedzie polegala osobliwosc, bo to nie my ja stworzymy - komputer sam ja stworzy, a my bedziemy sie tylko temu przygladac nic nie rozumiejac"

Nie masz jeszcze konta? Zarejestruj się


Nakarm Pajacyka