Dodaj do ulubionych

"krnabrne" sekwencje

IP: *.chello.pl 08.12.01, 06:35
Czy nie przyszloby Wam cos ciekawego do glowy na temat analizowania sekwencji?
Chodzi mi o szczegolny rodzaj sekwencji, dzisiaj coraz bardziej modny:
sekwencje biologiczne.
Chodzi o przyjecie takiej strategii zbierania informacji o sekwencji, aby mozna
bylo uchwycic jej istotne cechy, istotne bo, w komorce, przetlumaczone na
pozniejsze dzialanie.
Dobra, oto konkret: zaleznosc struktury przestrzennej bialka od sekwencji
aminokwasow. Wychwycenie tej zaleznosci jest warte Nagrody Nobla, wiec badacze
zadowalaja sie celem polowicznym: okresleniem struktury 2-rzedowej na podstawie
sekwencji, albo tylko jakis okreslonych parametrow liczbowych ostatecznych
bialek. Ewentualna, chocby czesciowa, znajomosc takich zaleznosci bylaby
ogromnie wazna np. w przemysle farmaceutycznym, bo pozwalalaby na znacznie
szybsze i precyzyjniejsze otrzymywanie enzymow o zadanych wlasnosciach, czyli
bardziej skutecznych lekow!

W domenie Eksploracji Baz Danych ("Data Mining") Stosuje sie rozne algorytmy,
np. Sieci Neuronowe uczone na zbiorach treningowych, jednak zawsze jest wspolny
slaby punkt tych wysilkow. Chodzi o sposoby analizowania samych sekwencji.
Poniewaz potrzebna jest globana informacja o sekwencji ("globalna", tj. o calej
sekwencji, a nie o jej fragmencie), wiec najczestszym podejsciem jest metoda
typu automat z pamiecia, skanujacy sekwencje. Otoz, automat ow wyposazony jest
w wewnetrzna pamiec, wejscie czytajace biezaca pozycje sekwencji, wewnetrzne
sprzezenie zwrotne i jakas swoja strukture przetwarzania danych. Automat ten
iteracyjnie skanuje sekwencje, od pierwszej pozycji az do ostatniej: w kazdym
kroku iteracji czyta pozycje sekwencji oraz odczytuje stan swych wenetrznych
zmiennych, aby po przetworzeniu tych 2-zrodlowych informacji, z powrotem
zapisac nowe wartosci zmiennych wewnetrznych. Tak wiec, po przeskanowaniu calej
sekwencji, w wewnetrznych zmiennych powinna byc zapisana jakby "historia" tego
skanowania, czyli jakas informacja dotyczaca calej sekwencji
Obserwuj wątek
    • Gość: tk Re: IP: *.chem.kuleuven.ac.be 09.12.01, 20:30
      Gość portalu: Muzykant napisał(a):

      > Czy nie przyszloby Wam cos ciekawego do glowy na temat analizowania sekwencji?
      > Chodzi mi o szczegolny rodzaj sekwencji, dzisiaj coraz bardziej modny:
      > sekwencje biologiczne.
      > Chodzi o przyjecie takiej strategii zbierania informacji o sekwencji, aby mozna
      >
      > bylo uchwycic jej istotne cechy, istotne bo, w komorce, przetlumaczone na
      > pozniejsze dzialanie.
      > Dobra, oto konkret: zaleznosc struktury przestrzennej bialka od sekwencji
      > aminokwasow. Wychwycenie tej zaleznosci jest warte Nagrody Nobla, wiec badacze
      > zadowalaja sie celem polowicznym: okresleniem struktury 2-rzedowej na podstawie
      >
      > sekwencji, albo tylko jakis okreslonych parametrow liczbowych ostatecznych
      > bialek. Ewentualna, chocby czesciowa, znajomosc takich zaleznosci bylaby
      > ogromnie wazna np. w przemysle farmaceutycznym, bo pozwalalaby na znacznie
      > szybsze i precyzyjniejsze otrzymywanie enzymow o zadanych wlasnosciach, czyli
      > bardziej skutecznych lekow!

      Ejze, nie jest tak zle. Znajac strukture pierwszorzedowa, mozna calkiem dokladnie
      przewidziec drugorzedowa. Na poziomie trzeciorzedowej sprawa sie komplikuje,
      mowiac dokladnie zawodzi moc obliczniowa komputerow. Poza tym taki problem nie ma
      jednego rozwiazania, dla niezbyt duzego peptydu bediz istnialo kilkanascie
      konformacji rozniacych sie energia mniej niz 3 kcal/mol.
      W kazdym razie modelowanie centrow aktywnych enzymow (a wiec struktury
      trzecirzedowej) jest juz calkiem zaawansowane. Nie robi sie tego jednek softwarem
      dostepnym komercyjnie, firmy farmaceutyczne maja z reguly swoje wlasne programy,
      zaawansowane w stopniu o jakim normalnie nikt nie ma pojecia.
      • Gość: Muzykant proces zwijania bialka - procesem chaotycznym? IP: *.chello.pl 10.12.01, 22:06
        Gość portalu: tk napisał(a):
        > Znajac strukture pierwszorzedowa, mozna calkiem dokladnie
        > przewidziec drugorzedowa.

        Co masz na mysli? Owszem, sa serwisy na roznych portalach biologicznych baz
        danych, gdzie gosc-uzytkownik podaje sekwencje a otrzymuje mape struktur
        drugorzedowych. Stosuje sie tam rozmaite algorytmy, nie tylko sieci neuronowe,
        ale co masz wlasciwe na mysli mowiac "calkiem dokladnie"? 80%? Oraz co masz na
        mysli mowiac "przewidziec (str.) drugorzedowa"? (Nie mylisz z przynaleznoscia do
        klasy str. drugorz.?)

        Wiekszosc z tych algorytmow przewiduje na zasadzie eksploracji baz danych.
        (Znaczy to, ze pewien system nauczyl sie czegos o zaleznosciach pomiedzy str.
        bialek z tzw. zbioru uczacego. Zwykle jest to "nieredundantny" zbior bialkowych
        sekwencji, czyli sekwencji podobnych do siebie nie wiecej niz w 20%, zbior
        liczacy ok. 1000 przykladow bialek o znanych konformacjach. Nastepnie ta nauczona
        przez system wiedza jest uogolniana na wszystkie proteiny...)
        Zapoznalem sie z wieloma algorytmami i mam wrazenie, ze (pod wieloma wzgledami)
        nie sa doskonale. (Zreszta chodziloby o tzw. "ekstrakcje regul" raczej niz tylko
        umiejetnosc przewidywania, jak w sieciach neuronowych.)

        > Na poziomie trzeciorzedowej sprawa sie komplikuje,
        > mowiac dokladnie zawodzi moc obliczniowa komputerow.

        Z tego co slyszalem, to gdy probuje sie symulowc proces zwijania bialka, zawodzi
        m.in. precyzja reprezentacji danych. Troche jak w przypadku dlugoterminowego
        prognozowania pogody. Nie jestem pewien czy proces zwijania bialek nie jest
        przypadkiem procesem chaotycznym i dlatego pokazuje "fige z makiem"?

        > W kazdym razie modelowanie centrow aktywnych enzymow (a wiec struktury
        > trzecirzedowej) jest juz calkiem zaawansowane.
        > Nie robi sie tego jednek softwarem dostepnym komercyjnie,
        > firmy farmaceutyczne maja z reguly swoje wlasne programy,
        > zaawansowane w stopniu o jakim normalnie nikt nie ma pojecia.

        A czy wiesz jakie jest mniej wiecej podejscie? A przede wszystkim, czy jest to
        robione droga eksploracji baz danych (data mining) czy droga symulacji procesu
        zwijania?
        Oczywiste jest, ze ja moge byc zainteresowany TYLKO ta pierwsza droga, jako
        bardziej stawiajaca na zmyslnosc algorytmu niz szybkosc sprzetu obliczeniowego.
        Niedostepne sa dla zwyklych "szaraczkow" takie maszyny jak "blue gene" IBM!

        Z powazaniem
        Janek Muzykant
        • Gość: tk Re: proces zwijania bialka - procesem chaotycznym? IP: *.chem.kuleuven.ac.be 11.12.01, 14:21
          Gość portalu: Muzykant napisał(a):

          > Gość portalu: tk napisał(a):
          > > Znajac strukture pierwszorzedowa, mozna calkiem dokladnie
          > > przewidziec drugorzedowa.
          >
          > Co masz na mysli? Owszem, sa serwisy na roznych portalach biologicznych baz
          > danych, gdzie gosc-uzytkownik podaje sekwencje a otrzymuje mape struktur
          > drugorzedowych. Stosuje sie tam rozmaite algorytmy, nie tylko sieci neuronowe,
          > ale co masz wlasciwe na mysli mowiac "calkiem dokladnie"? 80%? Oraz co masz na
          > mysli mowiac "przewidziec (str.) drugorzedowa"? (Nie mylisz z przynaleznoscia d
          > o
          > klasy str. drugorz.?)
          (...)

          No, to wszystko wymaga dlugiej odpowiedzi. Po pierwsze chcialbym ostrzec, ze
          jestem chemikiem-syntetykiem (w dodatku nie od bialek!), a nie specjalista od
          obliczen, ale troche wiedzy na ten temat mam (chociaz nic nie sprawia mi takiej
          satysfakcji jak kolejna wpadka obliczeniowcow!).

          1. Bialka charakteryzuje sie przy pomocy czterech typow struktur: pierszo-, drugo-
          , trzecio- i czwartorzedowej. Struktura pierwsorzedowa to po prostu ulozenie
          aminokwasow w czasteczce, rzecz prosta do wyznaczenia poprzez sekwencjonowanie.
          Amniokwasy tworza nastepnie przestrzenna strukture drugorzedowa, ktorej
          glownymi "cegielkami" sa alfa-helisa, beta-zgiecie i klebek statystyczny. Taka
          struktura ulega zwijaniu tworzac strukture trzeciorzedowa. Wiele bialek
          zbudowanych jest z kilku podjednostek, ktore oddzialujac tworza strukture
          czwartorzedowa.

          2. Struktura pierwszorzedowa w duzym stopniu determinuje strukture drugorzedowa.
          Aminokwasy roznia sie znacznie wlasnosciami kwasowo-zasadowymi, hydrofilowoscia,
          sztywnoscia struktury, zdolnoscia do tworzenia wiazan wodorowych, etc. Pewne
          kombinacje aminokwasow zawsze (lub przynajmniezj z bardzo wysokim
          prawdopodobienstwem) tworza okreslony typ struktury drugorzedowej (przy czym dla
          samego beta-zgiecia istnieje chyba 7 podtypow). Na tym bazuja algorytmy
          wyznaczjace/obliczajace strukture drugorzedowa. Najwazniejsza jest chyba metoda
          Chou-Fasmana - nazwa z pamieci, ostatnio sluchalem o tym na wykladzie kolegi 9
          lat temu; on sam uzywal w swoich pracach algorytmu Lima. Zgodnosc obliczen z
          praktyka dochodzi do ca. 90%. Najwiekszy problem sprawial zdaje sie, zgodnie ze
          swoja nazwa, klebek statystyczny.

          3. Struktura trzeciorzedowa to juz tragedia. Nitka bialka zwija sie pod wplywem
          wiely czynnikow. Najwazniejszy jest tu kowalencyjny mostek dwusiarczkowy pomiedzy
          czasteczkami cysteiny, potem pojawia sie cala masa oddzialywan van der Waalsa,
          wiazania wodorowe, oddzialywania hydrofobowo-hydrofilowe (okreslenie wytrych, ale
          lubie je, bo to w koncu byla moja specjalnosc), etc.

          4. Zwijanie NIE JEST procesem losowym, gdyby tak bylo bialka nie moglyby pelnic
          swojej roli, w koncu musza istniec receptory, centra aktywne,... Struktura
          trzeciorzedowa nie zalezy tylko od funcji bialka, ale takze od otoczenia - w
          srodowisku hydrofilowym na powierzchni bialka beda znajdowac sie aminokwasy
          hydrofilowe, w hydrofobowym na odwrot i tak dalej. Sytuacje komplikuje to, ze
          bialka moga przylaczac czasteczki tluszczy czy cukrow tworzac odpowiednio lipo- i
          glikoproteiny. Takie "wypustki" na powierzchni beda oczywiscie modyfikowac
          hydriflowosc i inne parametry.

          5. Z tego, co dowiedzialem sie od kolegow, na powierzchni i w centrach aktywnych
          z reguly wystepuje beta zgiecie. Jest to zawsze jakas sugestia co do mozliwej
          struktury trzeciorzedowej.

          6. Programy dostepne w sieci to zabawki. Prawdziewe modelowanie odbywa sie z
          reguly na superkomputerach w firmach farmaceutycznych. Sam pracuje dla takiej
          firmy i dostaje od jej przedstawicieli polecenie zsyntezowania czegos, co zgodnie
          z obliczeniami pasuje idealnie do receptora[---] typu [---] (przykro mi, jestem
          zwiazany pisemnym zobowiazaniem do zachowania tajemnicy...). W kazdym razie ich
          oprogramowanie wyprzedza ogolnodostepne zabawki o kilka lat.

          7. Konformacja bialka moze sie zmieniac pod wplywem czynnikow zewnetrznych
          (chocby denaturacja i renaturacja), a takze ze wzgledu na pelniona funkcje (na
          przyklad po zakonczeniu reakcji enzymatycznej trzeba uwolnic produkt). Dobrym
          przykladem beda tu tez chyba te nieszczene priony, ktore podobno staja sie
          chorobotworcze zmieniajac swoja strukture. Jak pisalem w poprzednim poscie,
          istnieje wiele konformacji o zblizonej energii i niekoniecznie ta rzeczywista
          musi odpowiadac globalnemu minimum energetycznemu, a jedynie jakiemus lokalnemu,
          z mozliwoscia przejscia pomiedzy roznymi konformacjami.
          • Gość: wali7 Re: proces zwijania bialka - procesem chaotycznym? IP: *.wola-justowska.sdi.tpnet.pl 11.12.01, 17:10
            A ja ze swojej strony chciałbym dodać, że nie wszystko jest tak dokładnie znane jak chcieliby
            specjalisci od komputerów i algorytmów. Trzeba pamiętać, że białko uzyskuje swoją natywną
            konformację nie w próżni (jak zakładają niektóre programy symulujące - bawiłem się takim na
            studiach), nawet nie w wodzie, ale w skomplikowanej trójwymiarowej strukturze z błonami lipidowymi
            i rozmaitymi białkami (chociażby HSP). Oczywiscie, stosowny algorytm bazujacy na sieci neuronowej
            powinien poradzić sobie z tym problemem, ale otoczenie to zmienia się w zależnosci od warunków,
            typu komórki, czy rodzaju białka - stąd wyprodukowana baza danych byłaby naprawdę potężna, a i
            potrzebna moc obliczeniowa też staje się bardzo duża.
            Jak zauważył TK, proces przyjmowania własciwej konformacji nie może być losowy, w naszych
            komórkach powstawały by wtedy zdenaturowane produkty. Proces ten jest chaotyczny o tyle, że
            energie dzielące poszczególne konformacje są często bardzo niewielkie, niewielka zmiana warunków
            początkowych owocuje inną konformacją.
            Myslę, że w modelowaniu możnaby posłużyć się znanym algorytmem wyszukiwania okreslonych
            sekwencji hydrofobowych aminokwasów w celu wyszukania struktur drugorzędowych, a sieć
            neuronową wykorzystać w celu przewidzenia konformacji struktury trzeciorzędowej. Dzięki temu, że
            zmniejszy się znacznie ilosć obliczeń, będzie można rozbudować sieć, co powinno dać większą
            dokładnosć obliczeń.
            Życzę powodzenia i pozdrawiam
          • Gość: Muzykant chaotyczny=trudny do przewidzenia, ale nie losowy! IP: *.chello.pl 11.12.01, 18:26

            Gosc portalu: tk napisal(a):
            > Amniokwasy tworza nastepnie przestrzenna strukture drugorzedowa, ktorej
            > glownymi "cegielkami" sa alfa-helisa, beta-zgiecie i klebek statystyczny. Taka
            > struktura ulega zwijaniu tworzac strukture trzeciorzedowa.

            Przepraszam za ewentualna gafe, ale czy nie jest przypadkiem tak, ze str. 2-
            rzedowa jest tylko tworem abstrakcyjnym, wyodrebnionym (pomocniczo) ze struktury
            3-rz., czyli takim pojeciowym uogolnieniem? (Wowczas bledem byloby pisac "tworza
            nastepnie przestrzenna strukture drugorzedowa".)

            > Pewne kombinacje aminokwasow zawsze (lub przynajmniezj z bardzo wysokim
            > prawdopodobienstwem) tworza okreslony typ struktury drugorzedowej

            No wlasnie, dlatego wiekszosc algorytmow wyznacza do jakiego typu str. 2-rz. dana
            pozycja w sekwencji aminokwasow nalezy jedynie na podstawie informacji lokalnej,
            czyli o tym jak wyglada wycinek sekwencji w sasiedztwie. (Przesuwajace sie okno
            czytajace naraz np. 30 kolejnych amninokwasow i dajace po prostym bo
            jednokierunkowym, tj. bez zadnej pamieci wewnetrznej ani sprzezen zwrotnych itp,
            przetworzeniu tak pobranej informacji wynik o przynaleznosci pozycji z srodka
            tego okna.) Niestety do dokladniejszych wynikow niz 70% najprawdopodobniej
            potrzebna jest informacja globalna, czyli o postaci calej sekwencji (i tu
            niesmiealo widzialbym szanse dla tezy swojego doktoratu).

            > Chou-Fasmana - nazwa z pamieci, ostatnio sluchalem o tym na wykladzie kolegi 9
            > lat temu; on sam uzywal w swoich pracach algorytmu Lima.
            > Zgodnosc obliczen z praktyka dochodzi do ca. 90%.

            Bardzo bym prosil o dokladniejsza nazwe algorytmu dajacego 90%!

            Z tego co mozna znalezc w Internecie wynika, ze najpopularniejsze metody to
            (cytuje z jednego z popularnych serwisow):
            - PSI-Pred, Q3 score (mean prediction accuracy) 77%,
            - PREDATOR, Q3 score 68% for an input of a single query sequence, and 75% set of
            related sequences,
            - PHD neural network prediction builds a multiple sequence alignment from the
            most recent version of Swiss-Prot.

            Tak wiec jednak duzo mniej niz 90%.

            > Struktura trzeciorzedowa to juz tragedia. (...)
            > Najwazniejszy jest tu kowalencyjny mostek dwusiarczkowy pomiedzy
            > czasteczkami cysteiny, potem pojawia sie cala masa oddzialywan van der Waalsa,
            > wiazania wodorowe, oddzialywania hydrofobowo-hydrofilowe
            (...)
            > na powierzchni i w centrach aktywnych
            > z reguly wystepuje beta zgiecie.

            Ale ta lista nie jest kompletna, nieprawdaz? Wlasnie temu sluza metody
            eksploracji baz danych (data mining) prowadzace do ekstrakcji regul (rule
            extraction). Z drugiej strony, do skutecznej sumulacji procesu zwijania
            (przeprowadzana na superkomputerach) potrzebna jest kompletna znajomosc
            wszystkich mechanizmow. Tak wiec te dwie drogi, ktore poprzednio wyszczegolnilem,
            zazebiaja sie i uzupelniaja wzajemnie...

            Nie mniej dziekuje za to repetytorium!

            > 4. Zwijanie NIE JEST procesem losowym

            Alez oczywiscie, ze nie! Piszac "proces chaotyczny" chyba popelnilem drobnego
            naduzycia bo to pewnie niescisle. Mialem na mysli, iz uklad srodowisko+sekwencja
            aminokwasow, majaca sie zwinac, stanowia dynamiczny uklad chaotyczny, czyli uklad
            ktorego koncowy stan jest bardzo wrazliwy na warunki poczatkowe. Koncowym stanem
            tutaj jest struktura 3-rz., a warunkami pocz. jest str. 1-rz., czyli postac
            sekwencji .
            Czyz nie jest tak, ze "podmiana" na jednej tylko pozycji sekwencji (zamiana
            jadnego aminokwasu) moze spowodowac, ze sekwencja zwinie sie w czasteczke o
            zupelnie innej str. przestrzennej i innych wlasciwosciach, lub nie bedzie chciala
            sie zwinac? Oczywiscie wiem, ze nie wszystkie pozycje sa tak wrazliwe.

            > Struktura
            > trzeciorzedowa nie zalezy tylko od funcji bialka, ale takze od otoczenia

            No tak, war. srodowiska tez stanowia istotny element war. poczatkowych.

            > 6. Programy dostepne w sieci to zabawki. Prawdziewe modelowanie odbywa sie z
            > reguly na superkomputerach w firmach farmaceutycznych.
            > (przykro mi, jestem
            > zwiazany pisemnym zobowiazaniem do zachowania tajemnicy...).
            > ich oprogramowanie wyprzedza ogolnodostepne zabawki o kilka lat.

            Oprogramowanie superkomputerow najpewniej dotyczy symulacji procesu zwijania.
            Tyle chyba mozesz ujawnic?
            Jasli tak, to jest to inna droga...
            Czy fakt, ze sa to rozwiazania utajnione, a wiec nieobecne w oficjalnej nauce,
            nie sprawia przypadkiem, ze np. taki doktorant, ktory musi sie wykazac jakims
            orginalnym rozwiazaniem, po prostu moze spokojnie uznac, ze nic takiego nie
            istnieje?
            W szczegolnosci, gdy ten doktorant przesle swoje prace do opublikowania w
            renomowanym czasopismie naukowym, czy moze byc spokojny o uznanie orginalnosci
            swoich idei? Czy firma, ktora nagle sie obudzi i zglosi pretensje, ze pierwsza na
            to wpadla, nie jest na pozycji straconej gdy tego wczesniej nie opublikowala?
            Byc moze moje pytanie jest naiwne i kazdy moze przypomniec o takiej instytucji
            jak patent. W tym kontekscie dwie moje uwagi:
            1.) slyszalem o patentowaniu produktu biotechnologicznego: nowego genu, nowego
            enzymu, czy nawet jekiejs techniki, z punktu widzenia biologii mol., tego
            otrzymywania, ale nie slyszalem o narzedziu bioinformatycznym,
            2.) opantetowanie nie oznacza utajnienia, a jedynie zarezerwowanie sobie praw do
            wykorzystania, natomiast kazdy moze zaznajomic sie z tym "jak to dziala".

            > 7. Konformacja bialka moze sie zmieniac pod wplywem czynnikow zewnetrznych
            > (...), a takze ze wzgledu na pelniona funkcje

            Oswiec wiec prosze, jaki wobec tego ma sens przewidywanie strukt. 3D, lub chociaz
            2-rz?

            Z powazaniem
            Janek Muzykant

            • Gość: tk Re: chaotyczny=trudny do przewidzenia, ale nie losowy! IP: *.chem.kuleuven.ac.be 11.12.01, 19:33
              Gość portalu: Muzykant napisał(a):

              > Przepraszam za ewentualna gafe, ale czy nie jest przypadkiem tak, ze str. 2-
              > rzedowa jest tylko tworem abstrakcyjnym, wyodrebnionym (pomocniczo) ze struktu
              > ry 3-rz., czyli takim pojeciowym uogolnieniem? (Wowczas bledem byloby
              > pisac "tworza nastepnie przestrzenna strukture drugorzedowa".)

              Twoje stwierdzenie jest tak samo prawdziwe jak zdanie "cegla jest tworem
              abstrakcyjnym, wyodrebnionym (pomocniczo) ze struktury budynku". Struktura
              drugorzedowa MUSI byc (i jest) scisle okreslona, bo inaczej bialko byloby
              nieaktywne.

              > No wlasnie, dlatego wiekszosc algorytmow wyznacza do jakiego typu str. 2-rz. da
              > na pozycja w sekwencji aminokwasow nalezy jedynie na podstawie informacji
              > lokalnej, czyli o tym jak wyglada wycinek sekwencji w sasiedztwie.

              Trzeba pamietac, ze struktura 2-rz bialka (helisa, zgiecie, klebek,...) moze
              zmieniac sie co kilka aminokwasow. Nie ma (chyba?) bialek zlozonych tylko i
              wylacznie ze struktury helikalnej.

              > Bardzo bym prosil o dokladniejsza nazwe algorytmu dajacego 90%!

              Kolega nazywa sie Jacek Leluk, kiedys Instytut Biochemii Uniwersytetu
              Wroclawskiego, co robi teraz - nie wiem.
              >
              >
              > > 4. Zwijanie NIE JEST procesem losowym
              >
              > Alez oczywiscie, ze nie! Piszac "proces chaotyczny" chyba popelnilem drobnego
              > naduzycia bo to pewnie niescisle. Mialem na mysli, iz uklad
              > srodowisko+sekwencj a aminokwasow, majaca sie zwinac, stanowia dynamiczny
              > uklad chaotyczny, czyli uklad ktorego koncowy stan jest bardzo wrazliwy na
              > warunki poczatkowe. Koncowym stanem tutaj jest struktura 3-rz., a warunkami
              > pocz. jest str. 1-rz., czyli postac sekwencji .

              Struktura pierwsorzedowa danego bialka jest NIEZMIENNA, nie chaotyczna, nie
              losowa, tylko NIEZMIENNA. Bialko z podmienionym jednym aminokwasem jest zupelnie
              innym tworem o prawdopodobnie zmienionych wlasciwosciach.

              > Czyz nie jest tak, ze "podmiana" na jednej tylko pozycji sekwencji (zamiana
              > jadnego aminokwasu) moze spowodowac, ze sekwencja zwinie sie w czasteczke o
              > zupelnie innej str. przestrzennej i innych wlasciwosciach, lub nie bedzie chcia
              > la sie zwinac? Oczywiscie wiem, ze nie wszystkie pozycje sa tak wrazliwe.

              Napisalem to, co powyzej, a potem zobaczylem to pytanie...

              > No tak, war. srodowiska tez stanowia istotny element war. poczatkowych.

              Sprobuje wytlumaczyc tak, zeby bylo prosto i nie spieprzyc. Bialko enzymatyczne
              jest tak naprawde mikroreaktorem chemicznym. Jego zadaniem jest przeprowadzenie
              jakiej selektywnej transformacji. Do tego celu ma ono wyspecjalizowane centrum
              aktywne, wktorym znajduje sie KILKA (2,5,10? nie wiecej!) aminokwasow, ktorych
              kazdy odpowiada z jakis element procesu (His-135 kordynuje jon miedzi, Ser-112
              uwiaze substrat poprzez estryfikacje, Phe-225 zapewnia hydrofobowosc - to
              wydumany przeze mnie przyklad). Cala reszta to otoczka, ktora stabilizuje uklad,
              zapewnia sztywnosc i pozwala bialku utrzymywac sie w mikrosrodowisku (blona
              komorkowa, jadro,...).

              > Oprogramowanie superkomputerow najpewniej dotyczy symulacji procesu zwijania.
              > Tyle chyba mozesz ujawnic?
              > Jasli tak, to jest to inna droga...

              Sorry...

              > Czy fakt, ze sa to rozwiazania utajnione, a wiec nieobecne w oficjalnej nauce,
              > nie sprawia przypadkiem, ze np. taki doktorant, ktory musi sie wykazac jakims
              > orginalnym rozwiazaniem, po prostu moze spokojnie uznac, ze nic takiego nie
              > istnieje?

              Jak to w nauce. Nieopublikowane = nie istnieje.

              > W szczegolnosci, gdy ten doktorant przesle swoje prace do opublikowania w
              > renomowanym czasopismie naukowym, czy moze byc spokojny o uznanie orginalnosci
              > swoich idei? Czy firma, ktora nagle sie obudzi i zglosi pretensje, ze pierwsza
              > na to wpadla, nie jest na pozycji straconej gdy tego wczesniej nie opublikowala?

              Oczywiscie. Chyba, ze utraci Cie recenzent, zwiazany z dana firma.

              > Byc moze moje pytanie jest naiwne i kazdy moze przypomniec o takiej instytucji
              > jak patent. W tym kontekscie dwie moje uwagi:
              > 1.) slyszalem o patentowaniu produktu biotechnologicznego: nowego genu, nowego
              > enzymu, czy nawet jekiejs techniki, z punktu widzenia biologii mol., tego
              > otrzymywania, ale nie slyszalem o narzedziu bioinformatycznym,

              Gdzies byl watek "czy mozna opatentowac rownanie". Wyslo na to, ze chyba nie,
              wiec firmy sie nie wychylaja. Poza tym taki patent bylby bardzo niekorzystny dla
              firmy. Patentujesz algorytm, konkurencja go widzi, robi w tajemnicy swoj program,
              na podstawie wynikow opracowuje nowy lek. Nie ma zadnego dowodu, ze skorzystala z
              tego algorytmu, a udowodnic sie tego w zaden sposob nie da (Wyszlo nam przez
              przypadek! A co? Nie wolno!?).

              > 2.) opantetowanie nie oznacza utajnienia, a jedynie zarezerwowanie sobie praw d
              > o wykorzystania, natomiast kazdy moze zaznajomic sie z tym "jak to dziala".

              No wlasnie

              > Oswiec wiec prosze, jaki wobec tego ma sens przewidywanie strukt. 3D, lub choci
              > az 2-rz?

              Wlasciwie sens ma dazenie do opisania struktury 3-rz i to takiej, jaka istnieje
              in vivo. Do tej pory wykrystalizowano wiele biale i wyznaczono metodami
              rentgenograficznymi ich struktury. Problem w tym, ze nikt nie da glowy, ze taka
              sama konformacja istnieje w organizmie zywym. Wszytkie te badania sa potrzebne,
              zeby opracowywac nowe leki, pasujace strukturalnie do centrow aktywnych enzymow
              (beda to leki typu inhibitorow) lub receptorow (antagonisty i agonisty). No i
              poznac mechanizmy dzialania...

              A przy okazji zrobic kilka doktoratow i habilitacji!
              • Gość: Muzykant globalna info: interrakcja oddalonych motywow? IP: *.chello.pl 11.12.01, 21:06
                Gość portalu: tk napisał(a):
                > Twoje stwierdzenie jest tak samo prawdziwe jak zdanie "cegla jest tworem
                > abstrakcyjnym, wyodrebnionym (pomocniczo) ze struktury budynku".

                No, ale dom powstaje budowany przez ludzi wlasnie z cegiel, a wiec z elementow
                nie tyle pojeciowych co budulcowych. A bialko samo powstaje, a ludzie probuja
                (bezskutecznie) zrozumiec jak. Czy jestes pewien, ze elementy struktury 2-rz.
                mozna traktowac jak elementy budulcowe, a wiec istniejace apriori, a nie jako
                pomocne pojecie, choc scisle zdefiniowane to potrzebne tylko do analizy, a wiec
                istniejace aposteriori (tak jak wyodrebnia sie anatomiczne czesci ciala zywego
                organizmu)?

                > > wiekszosc algorytmow wyznacza do jakiego typu str. 2-rz. dana
                > > pozycja w sekwencji aminokwasow nalezy jedynie na podstawie informacji
                > > lokalnej, czyli o tym jak wyglada wycinek sekwencji w sasiedztwie.
                >
                > Trzeba pamietac, ze struktura 2-rz bialka (helisa, zgiecie, klebek,...) moze
                > zmieniac sie co kilka aminokwasow. Nie ma (chyba?) bialek zlozonych tylko i
                > wylacznie ze struktury helikalnej.

                Chyba male nieporozumienie. Owszem, najwiecej ma do powiedzenia o str. 2-rz.
                danej pozycji lokalna podsekwencja z jej otoczenia. Ale tylko w 70% (jak sugeruje
                skutecznosc opartych na lokalnej info algorytmow). W pozostalych 30% wplywaja na
                str. 2-rz. rozpatrywanej pozycji najprawdopodobniej jakies podsekwencje znacznie
                oddalone, np. z drugiego konca calej sekwencji. W pewnym artykule wyczytalem
                hipoteze, ze calkiem odlegle podsekwencje (motywy), pozniej do siebie "przylgna",
                bo pasuja do siebie jak ulal (w danym sensie).
                Czy jestes wrogiem hipotezy o globalnych oddzialywaniach? (Moj potencjalny
                recenzent jest tego zwolennikiem.)

                > Kolega nazywa sie Jacek Leluk, kiedys Instytut Biochemii Uniwersytetu
                > Wroclawskiego, co robi teraz - nie wiem.

                Bardzo dziekuje! Sprobuje poszukac w Internecie. Czy Twoj kolega jest autorem
                tego algorytmu (potrzebne mi to do szukania)?

                > Struktura pierwsorzedowa danego bialka jest NIEZMIENNA, nie chaotyczna, nie
                > losowa, tylko NIEZMIENNA.

                No dobra, znowu moja niescislosc. Moze blizej prawdy jest powiedziec:
                uklad srodowisko+ulozenie przestrzenne aminokwasow zwiazanych ze soba sekwencja
                stanowia dynamiczny uklad chaotyczny.

                Sekwencja jest niezmienna, ale ulozenie przestrzenne aminokwasow podczas procesu
                zwijania - tak. Sekwencja i srodowisko, bardziej ogolnie, mozemy potraktowac jako
                osadzone w pewnej przestrzeni roznych sekwencji i srodowisk i dalej rozpatrywac
                ewolucje ukladu przy zalozeniu stalosci tych 2 parametrow: sekwencji i
                srodowiska. Byc moze znowu popelnilem blad, czy takie okreslenie sklonny jestes
                teraz zaakceptowac?

                > Cala reszta to otoczka, ktora stabilizuje uklad,
                > zapewnia sztywnosc i pozwala bialku utrzymywac sie w mikrosrodowisku

                Wygladaloby, ze ta "cala reszta" str. 3D to kandydatka, aby zalezec od globalnych
                usytuowan posczegolnych podsekwencji (motywow - czy czegos nie pomylilem?).

                Z powazaniem
                Janek Muzykant
                • Gość: tk Re: globalna info: interrakcja oddalonych motywow? IP: *.chem.kuleuven.ac.be 12.12.01, 09:56
                  Gość portalu: Muzykant napisał(a):

                  > No, ale dom powstaje budowany przez ludzi wlasnie z cegiel, a wiec z elementow
                  > nie tyle pojeciowych co budulcowych. A bialko samo powstaje, a ludzie probuja
                  > (bezskutecznie) zrozumiec jak. Czy jestes pewien, ze elementy struktury 2-rz.
                  > mozna traktowac jak elementy budulcowe, a wiec istniejace apriori, a nie jako
                  > pomocne pojecie, choc scisle zdefiniowane to potrzebne tylko do analizy, a wiec
                  > istniejace aposteriori (tak jak wyodrebnia sie anatomiczne czesci ciala zywego
                  > organizmu)?

                  Wydaje mi sie, ze tak jest. Zreszta te wlasnie elementy widac dokladnie na
                  rentgenogramach.
                  >

                  > Chyba male nieporozumienie. Owszem, najwiecej ma do powiedzenia o str. 2-rz.
                  > danej pozycji lokalna podsekwencja z jej otoczenia. Ale tylko w 70% (jak sugeru
                  > je skutecznosc opartych na lokalnej info algorytmow). W pozostalych 30%
                  > wplywaja na str. 2-rz. rozpatrywanej pozycji najprawdopodobniej jakies
                  > podsekwencje znacznie oddalone, np. z drugiego konca calej sekwencji. W pewnym
                  > artykule wyczytalem hipoteze, ze calkiem odlegle podsekwencje (motywy), pozniej
                  > do siebie "przylgna", bo pasuja do siebie jak ulal (w danym sensie).
                  > Czy jestes wrogiem hipotezy o globalnych oddzialywaniach? (Moj potencjalny
                  > recenzent jest tego zwolennikiem.)

                  Punkt dla Ciebie. A nawet dwa punkty. Dokladnie.

                  >
                  > > Kolega nazywa sie Jacek Leluk, kiedys Instytut Biochemii Uniwersytetu
                  > > Wroclawskiego, co robi teraz - nie wiem.
                  >
                  > Bardzo dziekuje! Sprobuje poszukac w Internecie. Czy Twoj kolega jest autorem
                  > tego algorytmu (potrzebne mi to do szukania)?

                  Uzywal algorytmu Lima (niezbyt popularnego, ale twierdzil, ze jest b. dobry).
                  Poza tym ostatnio widzialem go 7 lat temu, wiec nie wiem czy sie posunal w
                  pracach, a raczej czy sie w ogole posunal - byl postacia, delikatnie mowiac -
                  nitypowa i nietuzinkowa.
                  >
                  > No dobra, znowu moja niescislosc. Moze blizej prawdy jest powiedziec:
                  > uklad srodowisko+ulozenie przestrzenne aminokwasow zwiazanych ze soba sekwencja
                  > stanowia dynamiczny uklad chaotyczny.

                  OK. Wiecej nacisku na dynamiczny, mniej na chaotyczny.
                  >
                  > Sekwencja jest niezmienna, ale ulozenie przestrzenne aminokwasow podczas proces
                  > u zwijania - tak. Sekwencja i srodowisko, bardziej ogolnie, mozemy potraktowac
                  > jako osadzone w pewnej przestrzeni roznych sekwencji i srodowisk i dalej
                  > rozpatrywac
                  > ewolucje ukladu przy zalozeniu stalosci tych 2 parametrow: sekwencji i
                  > srodowiska. Byc moze znowu popelnilem blad, czy takie okreslenie sklonny jestes
                  > teraz zaakceptowac?

                  Z przyjemnoscia. Ale srodowisko tez sie nieco zmienia, przynajmniej w niektorych
                  przypadkach (raczej w wielu).

                  >
                  > Wygladaloby, ze ta "cala reszta" str. 3D to kandydatka, aby zalezec od globalny
                  > ch
                  > usytuowan posczegolnych podsekwencji (motywow - czy czegos nie pomylilem?).

                  Powtorz to jeszcze raz w prostszych slowach - z rana jestem dosc tepy (po
                  poludniu zreszta tez).
                • Gość: tk Re: globalna info: interrakcja oddalonych motywow? IP: *.chem.kuleuven.ac.be 12.12.01, 12:06
                  Tak zupelnie przy okazji, jaka literature (i ile!) zebrales do tej pory?
                  Czytujesz J. Comput. Chem. (jak dla mnie wyjatkowo obrzydliwe czasopismo!)? Ze
                  szczegolnym uwzglednieniem prac H.A. Scheragi. Wczoraj zapytalem komputer o
                  prace ze slowem kluczowym "protein folding" - wyrzucilo jakies 1500, po
                  zredukowaniu do "protein folding" + "theoretical or computational" dostalem
                  jakies 270 za ostatnie 6 lat.
                  • Gość: Muzykant szukanie publikacji... IP: *.chello.pl 12.12.01, 16:35
                    Gość portalu: tk napisał(a):
                    > Tak zupelnie przy okazji, jaka literature (i ile!) zebrales do tej pory?

                    Gdy odwiedzam biblioteke instytutu z ktorym wspopracuje to wyszukuje artykuly na
                    interesujacy mnie temat w roznych czasopismach poswieconych bioinformatyce i
                    okolicy, jak "J. Of Theoretical Biology", "Computational
                    Biology", "Proteins", "Protein Science" i inne "Journal Of ..." (mam nadzieje, ze
                    nie przekrecilem ktoregos tytulu).

                    Jednak przyznam, ze dawno tego nie robilem i raczej szukam publikacji w sieci.

                    > Czytujesz J. Comput. Chem. (jak dla mnie wyjatkowo obrzydliwe czasopismo!)?

                    Byc moze kilka artykulow z tego pisma przestudiowalem, m.in. utkwil mi w pamieci
                    art. o znajdywaniu tego ktore parametry czasteczek aminokwasow sa najistotniejsze
                    na podstawie maxymalizowania korelacji w wielu sekwencjach bialkowych...

                    > Wczoraj zapytalem komputer o prace ze slowem kluczowym (...)
                    > dostalem jakies 270 za ostatnie 6 lat.

                    Tak, ale ja poszukuje tu, na niniejszym forum, mozliwosci wymiany pogladow a
                    nawet konstruktywnego poprzekomarzania sie, abym, poprzez dodanie nieco emocji,
                    mogl sie troche wytracic ze stagnacji w jaka ostatnio popadlem.
                    Poza tym wiele informacji moze oznaczac balagan w ktorym szanse przetrwania
                    zwieksza jakas zewnetrzna sugestia...

    • Gość: Muzykant jak zebrac info o calej sekwencji (globalna)? IP: *.chello.pl 11.12.01, 20:08
      Gość portalu: wali7 napisał(a):

      "Myslę, że w modelowaniu możnaby posłużyć się znanym algorytmem wyszukiwania
      okreslonych sekwencji hydrofobowych aminokwasów w celu wyszukania struktur
      drugorzędowych..."

      Skutecznosc takich algorytmow jest ograniczona (ponizej 80%), mimo ze
      wykorzystuje sie (grupuje sie aminokwasy ze wzgledu na) nie tylko wlasnosci
      hydrobowe, ale tez inne parametry molekul aminkwasow.
      Ale, przede wszystkim, algorytmy takie wykorzystuja jedynie lokalne podsekwencje,
      czyli fragment sekwencji z bezposredniego sasiedztwa danego aminokwasu - pozycji
      calej sekwencji - dla wyznaczenia jego przynaleznosci do danego typu struktury
      drugorzedowej. Tutaj co niektorzy upatruja ograniczona skutecznosc (ok. 70%)
      przewidywania: do wiekszej skutecznosci potrzebne jest branie calosciowej
      (globalnej), a nie fragmentarycznej, iformacji o sekwencji aminokwasow!
      Bierze sie pod uwage kazdorazowo podsekwencje o stalej, stosunkowo malej
      dlugosci, z powodu banalnych ograniczen czysto technicznej natury (jak tutaj
      trudno oprzec sie wrazeniu). Po prostu stosunkowo latwo skonstruowac
      jadnokierunkowa siec neuronowa (albo cos podobnego) o stalej ilosci (np. 30)
      wejsc stanowiacych "okno", przez ktore widac lokalna podsekwencje.

      Sztuka sie zaczyna gdy sprobujemy zabrac informacje o calej sekwencji -
      strukturze pierwszorzedowej calego bialka, ktorej dlugosc moze wynosic zarowno 50
      pozycji, jak i 800 pozycji aminokwasow. Oraz zapisania takiej zmiennej rozmiarowo
      informacji w miejcu znacznie bardziej stalym, w np. 3 zmiennych, latwym do
      dalszego przetworzenia.
      Jak juz napisalem poprzednio, byla proba dokonania tego poprzez skanowanie
      sekwencji "od poczatku do konca" przez tzw. automat z pamiecia, ktory dzieki
      zmiennym wewnetrznym spietym petla sprzezenia zwrotnego, iteracyjnie zbiera
      historie widzianej po drodze sekwencji - wlasnie w tych zmiennych. Jednym z
      istotnych bledow takiego podejscia jest sztuczne wyroznienie "poczatku" i "konca"
      co daje male prawdopodobienstwo, iz wszystkie pozycje zostana uwzglednione jako
      potencjalnie majace takie samo znaczenie (np. te z "poczatku" historii moga miec
      tendencje do bycia "zapominanym").
      Dlatego zadalem tu pytanie: JAK DOSKONALE MOZNA ZEBRAC INFORMACJE O CALEJ
      SEKWENCJI roznej dlugosci? Prosze o SZALONE POMYSLY! Prosze o wziecie udzialu w
      BURZY MOZGOW! Z ewentualnych efektow takiej wymiany mysli ja osobiscie mialbym
      nadzieje skorzystac, o czym uczciwie uprzedzam. Jednak mam wrazenie, ze wiele
      innych osob najprawdopodobniej rowniez mogloby odniesc pewna korzysc!

      "...a sieć neuronową wykorzystać w celu przewidzenia konformacji struktury
      trzeciorzędowej"

      Ten sposob, "structure to structure NN", juz byl proponowany (nie pamietam w tej
      chwili gdzie dokladnie), lecz tez bez istotnego powodzenia. Ale dopoki
      skutecznosc przewidywania str. 2-rz. bedzie ukladac sie w okolicach 70%, nie
      mozna tego wykorzystac jako polproduktu-bazy do przewidywania czegos co jest
      naprawde o wiele powazniejszym problemem (chaotycznym-super wrazliwym na warunki
      poczatkowe)!

      Z powazaniem
      Janek Muzykant
      • Gość: wali7 Re: jak zebrac info o calej sekwencji (globalna)? IP: *.wola-justowska.sdi.tpnet.pl 12.12.01, 10:38
        Skoro pomysły mogą być "szalone" - nie ma sprawy. Ja nie siedzę w temacie tak bardzo jat Tk,
        niestety od zajęcia się doktoratem nie mam czasu na interesujące mnie niegdys zajęcia z zakresu
        modelowania dynamiki molekularnej białek, stąd moje sugestie możesz spokojnie traktować jako
        uwagi półlaika.
        Jak rozumiem, masz okno wejsciowe sieci powiedzmy 30 bramkowe. Skanujesz całą strukturę, i
        używasz sprzężeń zwrotnych co pozwala ci zachować informacje o wczesniejszych sekwencjach.
        Taka
        struktura sieci zapewne jest podatna na pojawienie się szkodliwych sprzężeń np. oscylacji,
        więc bardzo ważne jest zapewnienie optymalnej geometrii sieci. Jaka jest przyczyna niemożnosci
        zastosowania większej sieci? Szybkosć procesora? Ilosć pamięci? Jesli tak, to może jednak
        wyróżnienie sekwencji o konformacjach 2 rzędowych i zastąpienie ich stosownym identyfikatorem,
        czy
        raczej jednym z identyfikatorów zależnych od długosci tej sekwencji mogłoby znacząco zmniejszyć
        ilosć przetwarzanych danych bez straty dokładnosci. Zyskałbys możliwosć analizy całej struktury
        równolegle, co powinno dać znacznie większą sprawnosć przetwarzania i pojemnosć informacyjną
        sieci.
        Śledząc dyskusję jaką toczyłes z Tk zauważyłem, że masz wątpliwosci co do istnienia struktury
        drugorzędowej, poza kartką papieru oczywiscie. Struktury 2 rzędowe jak najbardziej istnieją, są to z
        reguły duże motywy, b. istotne dla całosci konformacji np. alfa helisy stanowią b. cząsto struktury
        zakotwiczające w błonie lipidowej - receptory białek G składają się zawsze z 7 struktur alfa
        helikalnych
        ułożonych równolegle do siebie i zakotwiczonych w błonie. Elementy stabilizujące strukturę 3
        rzędową
        (np. mostki S-S) z reguły stabilizują duże struktury 2 rzędu.
        Ostatnia sprawa: mógłbys mi podać garsć literatury z zakresu budowy sieci neuronowych, interesuje
        mnie to zagadnienie w związku z zupełnie innym projektem (nie związanym z białkami, niestety). Z
        góry dziękuję.
        Pozdrawiam
        • Gość: tk Re: jak zebrac info o calej sekwencji (globalna)? IP: *.chem.kuleuven.ac.be 12.12.01, 11:40
          Jak napisalem gdzies u gory, ja tez nie siedze w tym temacie, wiec nie
          dowartosciowuj mnie, prosze. Tym niemniej dziekuje za wsparcie w sprawie
          struktury 2-rzedowej.

          tk
        • Gość: Muzykant Re: literatura na temat sieci neuronowych IP: *.chello.pl 12.12.01, 17:24
          Gość portalu: wali7 napisał(a):
          > Ostatnia sprawa: mógłbys mi podać garsć literatury z zakresu budowy
          > sieci neuronowych

          Tejze literatury jest cala masa!
          W Internecie znajdziesz setki tysiecy prac na haslo "Neural Network" bowiem temat
          juz dawno niesamowicie zyskal na popularnosci a i same "sieci neuronowe" to
          bardzo szeroka dziedzina. Jest ich chyba blisko setka roznych odmian, typow i
          wariacji.
          Napisz wiec, co Cie dokladnie interesuje to moze Ci podsune jakis link.

          Bo jesli chodzi o ogolne wprowadzenie, to wystarczy udac sie do jakiejs ksiegarni
          naukowej i z pewnoscia cos sie tam znajdzie. Ja na przyklad zaczynalem od ksiazki
          Stanislawa Osowskiego "Sieci Neuronowe w ujeciu algorytmicznym".
          Ponadto wiele portali dedykowanych temu tematowi oferuje lagodne wprowadzenie i
          linki.
          Zobacz moze to FAQ:
          ftp://ftp.sas.com/pub/neural/FAQ.html
          albo wstepy:
          www.cs.stir.ac.uk/~lss/NNIntro/InvSlides.html
          www.neurocomputing.org/History/history.html
          strony International Neural Network Society:
          www.inns.org/
          i innych podobnych:
          www.loria.fr/equipes/rfia/cortex/
          vv.carleton.ca/~neil/neural/
          ale to sa tylko pierwsze lepsze przyklady z brzegu.

          W sumie to dzikeuje za pytanie, bo przy okazji natknalem sie na portale gdzie
          bede mogl znalezc cos inspirujacego dla siebie:
          www.geocities.com/sumeet_gupta/neural.html
          www.knowledgestorm.com/default.php

          Pozdrawiam

Nie masz jeszcze konta? Zarejestruj się


Nakarm Pajacyka