"krnabrne" sekwencje

Drzewko
Od najstarszego
Od najnowszego

Gość: tk Re: IP: *.chem.kuleuven.ac.be 09.12.01, 20:30

Gość portalu: Muzykant napisał(a):

> Czy nie przyszloby Wam cos ciekawego do glowy na temat analizowania sekwencji?
> Chodzi mi o szczegolny rodzaj sekwencji, dzisiaj coraz bardziej modny:
> sekwencje biologiczne.
> Chodzi o przyjecie takiej strategii zbierania informacji o sekwencji, aby mozna
>
> bylo uchwycic jej istotne cechy, istotne bo, w komorce, przetlumaczone na
> pozniejsze dzialanie.
> Dobra, oto konkret: zaleznosc struktury przestrzennej bialka od sekwencji
> aminokwasow. Wychwycenie tej zaleznosci jest warte Nagrody Nobla, wiec badacze
> zadowalaja sie celem polowicznym: okresleniem struktury 2-rzedowej na podstawie
>
> sekwencji, albo tylko jakis okreslonych parametrow liczbowych ostatecznych
> bialek. Ewentualna, chocby czesciowa, znajomosc takich zaleznosci bylaby
> ogromnie wazna np. w przemysle farmaceutycznym, bo pozwalalaby na znacznie
> szybsze i precyzyjniejsze otrzymywanie enzymow o zadanych wlasnosciach, czyli
> bardziej skutecznych lekow!

Ejze, nie jest tak zle. Znajac strukture pierwszorzedowa, mozna calkiem dokladnie
przewidziec drugorzedowa. Na poziomie trzeciorzedowej sprawa sie komplikuje,
mowiac dokladnie zawodzi moc obliczniowa komputerow. Poza tym taki problem nie ma
jednego rozwiazania, dla niezbyt duzego peptydu bediz istnialo kilkanascie
konformacji rozniacych sie energia mniej niz 3 kcal/mol.
W kazdym razie modelowanie centrow aktywnych enzymow (a wiec struktury
trzecirzedowej) jest juz calkiem zaawansowane. Nie robi sie tego jednek softwarem
dostepnym komercyjnie, firmy farmaceutyczne maja z reguly swoje wlasne programy,
zaawansowane w stopniu o jakim normalnie nikt nie ma pojecia.
- Gość: Muzykant proces zwijania bialka - procesem chaotycznym? IP: *.chello.pl 10.12.01, 22:06
  
  Gość portalu: tk napisał(a):
  > Znajac strukture pierwszorzedowa, mozna calkiem dokladnie
  > przewidziec drugorzedowa.
  
  Co masz na mysli? Owszem, sa serwisy na roznych portalach biologicznych baz
  danych, gdzie gosc-uzytkownik podaje sekwencje a otrzymuje mape struktur
  drugorzedowych. Stosuje sie tam rozmaite algorytmy, nie tylko sieci neuronowe,
  ale co masz wlasciwe na mysli mowiac "calkiem dokladnie"? 80%? Oraz co masz na
  mysli mowiac "przewidziec (str.) drugorzedowa"? (Nie mylisz z przynaleznoscia do
  klasy str. drugorz.?)
  
  Wiekszosc z tych algorytmow przewiduje na zasadzie eksploracji baz danych.
  (Znaczy to, ze pewien system nauczyl sie czegos o zaleznosciach pomiedzy str.
  bialek z tzw. zbioru uczacego. Zwykle jest to "nieredundantny" zbior bialkowych
  sekwencji, czyli sekwencji podobnych do siebie nie wiecej niz w 20%, zbior
  liczacy ok. 1000 przykladow bialek o znanych konformacjach. Nastepnie ta nauczona
  przez system wiedza jest uogolniana na wszystkie proteiny...)
  Zapoznalem sie z wieloma algorytmami i mam wrazenie, ze (pod wieloma wzgledami)
  nie sa doskonale. (Zreszta chodziloby o tzw. "ekstrakcje regul" raczej niz tylko
  umiejetnosc przewidywania, jak w sieciach neuronowych.)
  
  > Na poziomie trzeciorzedowej sprawa sie komplikuje,
  > mowiac dokladnie zawodzi moc obliczniowa komputerow.
  
  Z tego co slyszalem, to gdy probuje sie symulowc proces zwijania bialka, zawodzi
  m.in. precyzja reprezentacji danych. Troche jak w przypadku dlugoterminowego
  prognozowania pogody. Nie jestem pewien czy proces zwijania bialek nie jest
  przypadkiem procesem chaotycznym i dlatego pokazuje "fige z makiem"?
  
  > W kazdym razie modelowanie centrow aktywnych enzymow (a wiec struktury
  > trzecirzedowej) jest juz calkiem zaawansowane.
  > Nie robi sie tego jednek softwarem dostepnym komercyjnie,
  > firmy farmaceutyczne maja z reguly swoje wlasne programy,
  > zaawansowane w stopniu o jakim normalnie nikt nie ma pojecia.
  
  A czy wiesz jakie jest mniej wiecej podejscie? A przede wszystkim, czy jest to
  robione droga eksploracji baz danych (data mining) czy droga symulacji procesu
  zwijania?
  Oczywiste jest, ze ja moge byc zainteresowany TYLKO ta pierwsza droga, jako
  bardziej stawiajaca na zmyslnosc algorytmu niz szybkosc sprzetu obliczeniowego.
  Niedostepne sa dla zwyklych "szaraczkow" takie maszyny jak "blue gene" IBM!
  
  Z powazaniem
  Janek Muzykant
  - Gość: tk Re: proces zwijania bialka - procesem chaotycznym? IP: *.chem.kuleuven.ac.be 11.12.01, 14:21
    
    Gość portalu: Muzykant napisał(a):
    
    > Gość portalu: tk napisał(a):
    > > Znajac strukture pierwszorzedowa, mozna calkiem dokladnie
    > > przewidziec drugorzedowa.
    >
    > Co masz na mysli? Owszem, sa serwisy na roznych portalach biologicznych baz
    > danych, gdzie gosc-uzytkownik podaje sekwencje a otrzymuje mape struktur
    > drugorzedowych. Stosuje sie tam rozmaite algorytmy, nie tylko sieci neuronowe,
    > ale co masz wlasciwe na mysli mowiac "calkiem dokladnie"? 80%? Oraz co masz na
    > mysli mowiac "przewidziec (str.) drugorzedowa"? (Nie mylisz z przynaleznoscia d
    > o
    > klasy str. drugorz.?)
    (...)
    
    No, to wszystko wymaga dlugiej odpowiedzi. Po pierwsze chcialbym ostrzec, ze
    jestem chemikiem-syntetykiem (w dodatku nie od bialek!), a nie specjalista od
    obliczen, ale troche wiedzy na ten temat mam (chociaz nic nie sprawia mi takiej
    satysfakcji jak kolejna wpadka obliczeniowcow!).
    
    1. Bialka charakteryzuje sie przy pomocy czterech typow struktur: pierszo-, drugo-
    , trzecio- i czwartorzedowej. Struktura pierwsorzedowa to po prostu ulozenie
    aminokwasow w czasteczce, rzecz prosta do wyznaczenia poprzez sekwencjonowanie.
    Amniokwasy tworza nastepnie przestrzenna strukture drugorzedowa, ktorej
    glownymi "cegielkami" sa alfa-helisa, beta-zgiecie i klebek statystyczny. Taka
    struktura ulega zwijaniu tworzac strukture trzeciorzedowa. Wiele bialek
    zbudowanych jest z kilku podjednostek, ktore oddzialujac tworza strukture
    czwartorzedowa.
    
    2. Struktura pierwszorzedowa w duzym stopniu determinuje strukture drugorzedowa.
    Aminokwasy roznia sie znacznie wlasnosciami kwasowo-zasadowymi, hydrofilowoscia,
    sztywnoscia struktury, zdolnoscia do tworzenia wiazan wodorowych, etc. Pewne
    kombinacje aminokwasow zawsze (lub przynajmniezj z bardzo wysokim
    prawdopodobienstwem) tworza okreslony typ struktury drugorzedowej (przy czym dla
    samego beta-zgiecia istnieje chyba 7 podtypow). Na tym bazuja algorytmy
    wyznaczjace/obliczajace strukture drugorzedowa. Najwazniejsza jest chyba metoda
    Chou-Fasmana - nazwa z pamieci, ostatnio sluchalem o tym na wykladzie kolegi 9
    lat temu; on sam uzywal w swoich pracach algorytmu Lima. Zgodnosc obliczen z
    praktyka dochodzi do ca. 90%. Najwiekszy problem sprawial zdaje sie, zgodnie ze
    swoja nazwa, klebek statystyczny.
    
    3. Struktura trzeciorzedowa to juz tragedia. Nitka bialka zwija sie pod wplywem
    wiely czynnikow. Najwazniejszy jest tu kowalencyjny mostek dwusiarczkowy pomiedzy
    czasteczkami cysteiny, potem pojawia sie cala masa oddzialywan van der Waalsa,
    wiazania wodorowe, oddzialywania hydrofobowo-hydrofilowe (okreslenie wytrych, ale
    lubie je, bo to w koncu byla moja specjalnosc), etc.
    
    4. Zwijanie NIE JEST procesem losowym, gdyby tak bylo bialka nie moglyby pelnic
    swojej roli, w koncu musza istniec receptory, centra aktywne,... Struktura
    trzeciorzedowa nie zalezy tylko od funcji bialka, ale takze od otoczenia - w
    srodowisku hydrofilowym na powierzchni bialka beda znajdowac sie aminokwasy
    hydrofilowe, w hydrofobowym na odwrot i tak dalej. Sytuacje komplikuje to, ze
    bialka moga przylaczac czasteczki tluszczy czy cukrow tworzac odpowiednio lipo- i
    glikoproteiny. Takie "wypustki" na powierzchni beda oczywiscie modyfikowac
    hydriflowosc i inne parametry.
    
    5. Z tego, co dowiedzialem sie od kolegow, na powierzchni i w centrach aktywnych
    z reguly wystepuje beta zgiecie. Jest to zawsze jakas sugestia co do mozliwej
    struktury trzeciorzedowej.
    
    6. Programy dostepne w sieci to zabawki. Prawdziewe modelowanie odbywa sie z
    reguly na superkomputerach w firmach farmaceutycznych. Sam pracuje dla takiej
    firmy i dostaje od jej przedstawicieli polecenie zsyntezowania czegos, co zgodnie
    z obliczeniami pasuje idealnie do receptora[---] typu [---] (przykro mi, jestem
    zwiazany pisemnym zobowiazaniem do zachowania tajemnicy...). W kazdym razie ich
    oprogramowanie wyprzedza ogolnodostepne zabawki o kilka lat.
    
    7. Konformacja bialka moze sie zmieniac pod wplywem czynnikow zewnetrznych
    (chocby denaturacja i renaturacja), a takze ze wzgledu na pelniona funkcje (na
    przyklad po zakonczeniu reakcji enzymatycznej trzeba uwolnic produkt). Dobrym
    przykladem beda tu tez chyba te nieszczene priony, ktore podobno staja sie
    chorobotworcze zmieniajac swoja strukture. Jak pisalem w poprzednim poscie,
    istnieje wiele konformacji o zblizonej energii i niekoniecznie ta rzeczywista
    musi odpowiadac globalnemu minimum energetycznemu, a jedynie jakiemus lokalnemu,
    z mozliwoscia przejscia pomiedzy roznymi konformacjami.
    - Gość: wali7 Re: proces zwijania bialka - procesem chaotycznym? IP: *.wola-justowska.sdi.tpnet.pl 11.12.01, 17:10
      
      A ja ze swojej strony chciałbym dodać, że nie wszystko jest tak dokładnie znane jak chcieliby
      specjalisci od komputerów i algorytmów. Trzeba pamiętać, że białko uzyskuje swoją natywną
      konformację nie w próżni (jak zakładają niektóre programy symulujące - bawiłem się takim na
      studiach), nawet nie w wodzie, ale w skomplikowanej trójwymiarowej strukturze z błonami lipidowymi
      i rozmaitymi białkami (chociażby HSP). Oczywiscie, stosowny algorytm bazujacy na sieci neuronowej
      powinien poradzić sobie z tym problemem, ale otoczenie to zmienia się w zależnosci od warunków,
      typu komórki, czy rodzaju białka - stąd wyprodukowana baza danych byłaby naprawdę potężna, a i
      potrzebna moc obliczeniowa też staje się bardzo duża.
      Jak zauważył TK, proces przyjmowania własciwej konformacji nie może być losowy, w naszych
      komórkach powstawały by wtedy zdenaturowane produkty. Proces ten jest chaotyczny o tyle, że
      energie dzielące poszczególne konformacje są często bardzo niewielkie, niewielka zmiana warunków
      początkowych owocuje inną konformacją.
      Myslę, że w modelowaniu możnaby posłużyć się znanym algorytmem wyszukiwania okreslonych
      sekwencji hydrofobowych aminokwasów w celu wyszukania struktur drugorzędowych, a sieć
      neuronową wykorzystać w celu przewidzenia konformacji struktury trzeciorzędowej. Dzięki temu, że
      zmniejszy się znacznie ilosć obliczeń, będzie można rozbudować sieć, co powinno dać większą
      dokładnosć obliczeń.
      Życzę powodzenia i pozdrawiam
    - Gość: Muzykant chaotyczny=trudny do przewidzenia, ale nie losowy! IP: *.chello.pl 11.12.01, 18:26
      
      Gosc portalu: tk napisal(a):
      > Amniokwasy tworza nastepnie przestrzenna strukture drugorzedowa, ktorej
      > glownymi "cegielkami" sa alfa-helisa, beta-zgiecie i klebek statystyczny. Taka
      > struktura ulega zwijaniu tworzac strukture trzeciorzedowa.
      
      Przepraszam za ewentualna gafe, ale czy nie jest przypadkiem tak, ze str. 2-
      rzedowa jest tylko tworem abstrakcyjnym, wyodrebnionym (pomocniczo) ze struktury
      3-rz., czyli takim pojeciowym uogolnieniem? (Wowczas bledem byloby pisac "tworza
      nastepnie przestrzenna strukture drugorzedowa".)
      
      > Pewne kombinacje aminokwasow zawsze (lub przynajmniezj z bardzo wysokim
      > prawdopodobienstwem) tworza okreslony typ struktury drugorzedowej
      
      No wlasnie, dlatego wiekszosc algorytmow wyznacza do jakiego typu str. 2-rz. dana
      pozycja w sekwencji aminokwasow nalezy jedynie na podstawie informacji lokalnej,
      czyli o tym jak wyglada wycinek sekwencji w sasiedztwie. (Przesuwajace sie okno
      czytajace naraz np. 30 kolejnych amninokwasow i dajace po prostym bo
      jednokierunkowym, tj. bez zadnej pamieci wewnetrznej ani sprzezen zwrotnych itp,
      przetworzeniu tak pobranej informacji wynik o przynaleznosci pozycji z srodka
      tego okna.) Niestety do dokladniejszych wynikow niz 70% najprawdopodobniej
      potrzebna jest informacja globalna, czyli o postaci calej sekwencji (i tu
      niesmiealo widzialbym szanse dla tezy swojego doktoratu).
      
      > Chou-Fasmana - nazwa z pamieci, ostatnio sluchalem o tym na wykladzie kolegi 9
      > lat temu; on sam uzywal w swoich pracach algorytmu Lima.
      > Zgodnosc obliczen z praktyka dochodzi do ca. 90%.
      
      Bardzo bym prosil o dokladniejsza nazwe algorytmu dajacego 90%!
      
      Z tego co mozna znalezc w Internecie wynika, ze najpopularniejsze metody to
      (cytuje z jednego z popularnych serwisow):
      - PSI-Pred, Q3 score (mean prediction accuracy) 77%,
      - PREDATOR, Q3 score 68% for an input of a single query sequence, and 75% set of
      related sequences,
      - PHD neural network prediction builds a multiple sequence alignment from the
      most recent version of Swiss-Prot.
      
      Tak wiec jednak duzo mniej niz 90%.
      
      > Struktura trzeciorzedowa to juz tragedia. (...)
      > Najwazniejszy jest tu kowalencyjny mostek dwusiarczkowy pomiedzy
      > czasteczkami cysteiny, potem pojawia sie cala masa oddzialywan van der Waalsa,
      > wiazania wodorowe, oddzialywania hydrofobowo-hydrofilowe
      (...)
      > na powierzchni i w centrach aktywnych
      > z reguly wystepuje beta zgiecie.
      
      Ale ta lista nie jest kompletna, nieprawdaz? Wlasnie temu sluza metody
      eksploracji baz danych (data mining) prowadzace do ekstrakcji regul (rule
      extraction). Z drugiej strony, do skutecznej sumulacji procesu zwijania
      (przeprowadzana na superkomputerach) potrzebna jest kompletna znajomosc
      wszystkich mechanizmow. Tak wiec te dwie drogi, ktore poprzednio wyszczegolnilem,
      zazebiaja sie i uzupelniaja wzajemnie...
      
      Nie mniej dziekuje za to repetytorium!
      
      > 4. Zwijanie NIE JEST procesem losowym
      
      Alez oczywiscie, ze nie! Piszac "proces chaotyczny" chyba popelnilem drobnego
      naduzycia bo to pewnie niescisle. Mialem na mysli, iz uklad srodowisko+sekwencja
      aminokwasow, majaca sie zwinac, stanowia dynamiczny uklad chaotyczny, czyli uklad
      ktorego koncowy stan jest bardzo wrazliwy na warunki poczatkowe. Koncowym stanem
      tutaj jest struktura 3-rz., a warunkami pocz. jest str. 1-rz., czyli postac
      sekwencji .
      Czyz nie jest tak, ze "podmiana" na jednej tylko pozycji sekwencji (zamiana
      jadnego aminokwasu) moze spowodowac, ze sekwencja zwinie sie w czasteczke o
      zupelnie innej str. przestrzennej i innych wlasciwosciach, lub nie bedzie chciala
      sie zwinac? Oczywiscie wiem, ze nie wszystkie pozycje sa tak wrazliwe.
      
      > Struktura
      > trzeciorzedowa nie zalezy tylko od funcji bialka, ale takze od otoczenia
      
      No tak, war. srodowiska tez stanowia istotny element war. poczatkowych.
      
      > 6. Programy dostepne w sieci to zabawki. Prawdziewe modelowanie odbywa sie z
      > reguly na superkomputerach w firmach farmaceutycznych.
      > (przykro mi, jestem
      > zwiazany pisemnym zobowiazaniem do zachowania tajemnicy...).
      > ich oprogramowanie wyprzedza ogolnodostepne zabawki o kilka lat.
      
      Oprogramowanie superkomputerow najpewniej dotyczy symulacji procesu zwijania.
      Tyle chyba mozesz ujawnic?
      Jasli tak, to jest to inna droga...
      Czy fakt, ze sa to rozwiazania utajnione, a wiec nieobecne w oficjalnej nauce,
      nie sprawia przypadkiem, ze np. taki doktorant, ktory musi sie wykazac jakims
      orginalnym rozwiazaniem, po prostu moze spokojnie uznac, ze nic takiego nie
      istnieje?
      W szczegolnosci, gdy ten doktorant przesle swoje prace do opublikowania w
      renomowanym czasopismie naukowym, czy moze byc spokojny o uznanie orginalnosci
      swoich idei? Czy firma, ktora nagle sie obudzi i zglosi pretensje, ze pierwsza na
      to wpadla, nie jest na pozycji straconej gdy tego wczesniej nie opublikowala?
      Byc moze moje pytanie jest naiwne i kazdy moze przypomniec o takiej instytucji
      jak patent. W tym kontekscie dwie moje uwagi:
      1.) slyszalem o patentowaniu produktu biotechnologicznego: nowego genu, nowego
      enzymu, czy nawet jekiejs techniki, z punktu widzenia biologii mol., tego
      otrzymywania, ale nie slyszalem o narzedziu bioinformatycznym,
      2.) opantetowanie nie oznacza utajnienia, a jedynie zarezerwowanie sobie praw do
      wykorzystania, natomiast kazdy moze zaznajomic sie z tym "jak to dziala".
      
      > 7. Konformacja bialka moze sie zmieniac pod wplywem czynnikow zewnetrznych
      > (...), a takze ze wzgledu na pelniona funkcje
      
      Oswiec wiec prosze, jaki wobec tego ma sens przewidywanie strukt. 3D, lub chociaz
      2-rz?
      
      Z powazaniem
      Janek Muzykant
      - Gość: tk Re: chaotyczny=trudny do przewidzenia, ale nie losowy! IP: *.chem.kuleuven.ac.be 11.12.01, 19:33
        
        Gość portalu: Muzykant napisał(a):
        
        > Przepraszam za ewentualna gafe, ale czy nie jest przypadkiem tak, ze str. 2-
        > rzedowa jest tylko tworem abstrakcyjnym, wyodrebnionym (pomocniczo) ze struktu
        > ry 3-rz., czyli takim pojeciowym uogolnieniem? (Wowczas bledem byloby
        > pisac "tworza nastepnie przestrzenna strukture drugorzedowa".)
        
        Twoje stwierdzenie jest tak samo prawdziwe jak zdanie "cegla jest tworem
        abstrakcyjnym, wyodrebnionym (pomocniczo) ze struktury budynku". Struktura
        drugorzedowa MUSI byc (i jest) scisle okreslona, bo inaczej bialko byloby
        nieaktywne.
        
        > No wlasnie, dlatego wiekszosc algorytmow wyznacza do jakiego typu str. 2-rz. da
        > na pozycja w sekwencji aminokwasow nalezy jedynie na podstawie informacji
        > lokalnej, czyli o tym jak wyglada wycinek sekwencji w sasiedztwie.
        
        Trzeba pamietac, ze struktura 2-rz bialka (helisa, zgiecie, klebek,...) moze
        zmieniac sie co kilka aminokwasow. Nie ma (chyba?) bialek zlozonych tylko i
        wylacznie ze struktury helikalnej.
        
        > Bardzo bym prosil o dokladniejsza nazwe algorytmu dajacego 90%!
        
        Kolega nazywa sie Jacek Leluk, kiedys Instytut Biochemii Uniwersytetu
        Wroclawskiego, co robi teraz - nie wiem.
        >
        >
        > > 4. Zwijanie NIE JEST procesem losowym
        >
        > Alez oczywiscie, ze nie! Piszac "proces chaotyczny" chyba popelnilem drobnego
        > naduzycia bo to pewnie niescisle. Mialem na mysli, iz uklad
        > srodowisko+sekwencj a aminokwasow, majaca sie zwinac, stanowia dynamiczny
        > uklad chaotyczny, czyli uklad ktorego koncowy stan jest bardzo wrazliwy na
        > warunki poczatkowe. Koncowym stanem tutaj jest struktura 3-rz., a warunkami
        > pocz. jest str. 1-rz., czyli postac sekwencji .
        
        Struktura pierwsorzedowa danego bialka jest NIEZMIENNA, nie chaotyczna, nie
        losowa, tylko NIEZMIENNA. Bialko z podmienionym jednym aminokwasem jest zupelnie
        innym tworem o prawdopodobnie zmienionych wlasciwosciach.
        
        > Czyz nie jest tak, ze "podmiana" na jednej tylko pozycji sekwencji (zamiana
        > jadnego aminokwasu) moze spowodowac, ze sekwencja zwinie sie w czasteczke o
        > zupelnie innej str. przestrzennej i innych wlasciwosciach, lub nie bedzie chcia
        > la sie zwinac? Oczywiscie wiem, ze nie wszystkie pozycje sa tak wrazliwe.
        
        Napisalem to, co powyzej, a potem zobaczylem to pytanie...
        
        > No tak, war. srodowiska tez stanowia istotny element war. poczatkowych.
        
        Sprobuje wytlumaczyc tak, zeby bylo prosto i nie spieprzyc. Bialko enzymatyczne
        jest tak naprawde mikroreaktorem chemicznym. Jego zadaniem jest przeprowadzenie
        jakiej selektywnej transformacji. Do tego celu ma ono wyspecjalizowane centrum
        aktywne, wktorym znajduje sie KILKA (2,5,10? nie wiecej!) aminokwasow, ktorych
        kazdy odpowiada z jakis element procesu (His-135 kordynuje jon miedzi, Ser-112
        uwiaze substrat poprzez estryfikacje, Phe-225 zapewnia hydrofobowosc - to
        wydumany przeze mnie przyklad). Cala reszta to otoczka, ktora stabilizuje uklad,
        zapewnia sztywnosc i pozwala bialku utrzymywac sie w mikrosrodowisku (blona
        komorkowa, jadro,...).
        
        > Oprogramowanie superkomputerow najpewniej dotyczy symulacji procesu zwijania.
        > Tyle chyba mozesz ujawnic?
        > Jasli tak, to jest to inna droga...
        
        Sorry...
        
        > Czy fakt, ze sa to rozwiazania utajnione, a wiec nieobecne w oficjalnej nauce,
        > nie sprawia przypadkiem, ze np. taki doktorant, ktory musi sie wykazac jakims
        > orginalnym rozwiazaniem, po prostu moze spokojnie uznac, ze nic takiego nie
        > istnieje?
        
        Jak to w nauce. Nieopublikowane = nie istnieje.
        
        > W szczegolnosci, gdy ten doktorant przesle swoje prace do opublikowania w
        > renomowanym czasopismie naukowym, czy moze byc spokojny o uznanie orginalnosci
        > swoich idei? Czy firma, ktora nagle sie obudzi i zglosi pretensje, ze pierwsza
        > na to wpadla, nie jest na pozycji straconej gdy tego wczesniej nie opublikowala?
        
        Oczywiscie. Chyba, ze utraci Cie recenzent, zwiazany z dana firma.
        
        > Byc moze moje pytanie jest naiwne i kazdy moze przypomniec o takiej instytucji
        > jak patent. W tym kontekscie dwie moje uwagi:
        > 1.) slyszalem o patentowaniu produktu biotechnologicznego: nowego genu, nowego
        > enzymu, czy nawet jekiejs techniki, z punktu widzenia biologii mol., tego
        > otrzymywania, ale nie slyszalem o narzedziu bioinformatycznym,
        
        Gdzies byl watek "czy mozna opatentowac rownanie". Wyslo na to, ze chyba nie,
        wiec firmy sie nie wychylaja. Poza tym taki patent bylby bardzo niekorzystny dla
        firmy. Patentujesz algorytm, konkurencja go widzi, robi w tajemnicy swoj program,
        na podstawie wynikow opracowuje nowy lek. Nie ma zadnego dowodu, ze skorzystala z
        tego algorytmu, a udowodnic sie tego w zaden sposob nie da (Wyszlo nam przez
        przypadek! A co? Nie wolno!?).
        
        > 2.) opantetowanie nie oznacza utajnienia, a jedynie zarezerwowanie sobie praw d
        > o wykorzystania, natomiast kazdy moze zaznajomic sie z tym "jak to dziala".
        
        No wlasnie
        
        > Oswiec wiec prosze, jaki wobec tego ma sens przewidywanie strukt. 3D, lub choci
        > az 2-rz?
        
        Wlasciwie sens ma dazenie do opisania struktury 3-rz i to takiej, jaka istnieje
        in vivo. Do tej pory wykrystalizowano wiele biale i wyznaczono metodami
        rentgenograficznymi ich struktury. Problem w tym, ze nikt nie da glowy, ze taka
        sama konformacja istnieje w organizmie zywym. Wszytkie te badania sa potrzebne,
        zeby opracowywac nowe leki, pasujace strukturalnie do centrow aktywnych enzymow
        (beda to leki typu inhibitorow) lub receptorow (antagonisty i agonisty). No i
        poznac mechanizmy dzialania...
        
        A przy okazji zrobic kilka doktoratow i habilitacji!
        
        Gość: Muzykant globalna info: interrakcja oddalonych motywow? IP: *.chello.pl 11.12.01, 21:06
        
        Gość portalu: tk napisał(a):
        > Twoje stwierdzenie jest tak samo prawdziwe jak zdanie "cegla jest tworem
        > abstrakcyjnym, wyodrebnionym (pomocniczo) ze struktury budynku".
        
        No, ale dom powstaje budowany przez ludzi wlasnie z cegiel, a wiec z elementow
        nie tyle pojeciowych co budulcowych. A bialko samo powstaje, a ludzie probuja
        (bezskutecznie) zrozumiec jak. Czy jestes pewien, ze elementy struktury 2-rz.
        mozna traktowac jak elementy budulcowe, a wiec istniejace apriori, a nie jako
        pomocne pojecie, choc scisle zdefiniowane to potrzebne tylko do analizy, a wiec
        istniejace aposteriori (tak jak wyodrebnia sie anatomiczne czesci ciala zywego
        organizmu)?
        
        > > wiekszosc algorytmow wyznacza do jakiego typu str. 2-rz. dana
        > > pozycja w sekwencji aminokwasow nalezy jedynie na podstawie informacji
        > > lokalnej, czyli o tym jak wyglada wycinek sekwencji w sasiedztwie.
        >
        > Trzeba pamietac, ze struktura 2-rz bialka (helisa, zgiecie, klebek,...) moze
        > zmieniac sie co kilka aminokwasow. Nie ma (chyba?) bialek zlozonych tylko i
        > wylacznie ze struktury helikalnej.
        
        Chyba male nieporozumienie. Owszem, najwiecej ma do powiedzenia o str. 2-rz.
        danej pozycji lokalna podsekwencja z jej otoczenia. Ale tylko w 70% (jak sugeruje
        skutecznosc opartych na lokalnej info algorytmow). W pozostalych 30% wplywaja na
        str. 2-rz. rozpatrywanej pozycji najprawdopodobniej jakies podsekwencje znacznie
        oddalone, np. z drugiego konca calej sekwencji. W pewnym artykule wyczytalem
        hipoteze, ze calkiem odlegle podsekwencje (motywy), pozniej do siebie "przylgna",
        bo pasuja do siebie jak ulal (w danym sensie).
        Czy jestes wrogiem hipotezy o globalnych oddzialywaniach? (Moj potencjalny
        recenzent jest tego zwolennikiem.)
        
        > Kolega nazywa sie Jacek Leluk, kiedys Instytut Biochemii Uniwersytetu
        > Wroclawskiego, co robi teraz - nie wiem.
        
        Bardzo dziekuje! Sprobuje poszukac w Internecie. Czy Twoj kolega jest autorem
        tego algorytmu (potrzebne mi to do szukania)?
        
        > Struktura pierwsorzedowa danego bialka jest NIEZMIENNA, nie chaotyczna, nie
        > losowa, tylko NIEZMIENNA.
        
        No dobra, znowu moja niescislosc. Moze blizej prawdy jest powiedziec:
        uklad srodowisko+ulozenie przestrzenne aminokwasow zwiazanych ze soba sekwencja
        stanowia dynamiczny uklad chaotyczny.
        
        Sekwencja jest niezmienna, ale ulozenie przestrzenne aminokwasow podczas procesu
        zwijania - tak. Sekwencja i srodowisko, bardziej ogolnie, mozemy potraktowac jako
        osadzone w pewnej przestrzeni roznych sekwencji i srodowisk i dalej rozpatrywac
        ewolucje ukladu przy zalozeniu stalosci tych 2 parametrow: sekwencji i
        srodowiska. Byc moze znowu popelnilem blad, czy takie okreslenie sklonny jestes
        teraz zaakceptowac?
        
        > Cala reszta to otoczka, ktora stabilizuje uklad,
        > zapewnia sztywnosc i pozwala bialku utrzymywac sie w mikrosrodowisku
        
        Wygladaloby, ze ta "cala reszta" str. 3D to kandydatka, aby zalezec od globalnych
        usytuowan posczegolnych podsekwencji (motywow - czy czegos nie pomylilem?).
        
        Z powazaniem
        Janek Muzykant
        
        Gość: tk Re: globalna info: interrakcja oddalonych motywow? IP: *.chem.kuleuven.ac.be 12.12.01, 09:56
        
        Gość portalu: Muzykant napisał(a):
        
        > No, ale dom powstaje budowany przez ludzi wlasnie z cegiel, a wiec z elementow
        > nie tyle pojeciowych co budulcowych. A bialko samo powstaje, a ludzie probuja
        > (bezskutecznie) zrozumiec jak. Czy jestes pewien, ze elementy struktury 2-rz.
        > mozna traktowac jak elementy budulcowe, a wiec istniejace apriori, a nie jako
        > pomocne pojecie, choc scisle zdefiniowane to potrzebne tylko do analizy, a wiec
        > istniejace aposteriori (tak jak wyodrebnia sie anatomiczne czesci ciala zywego
        > organizmu)?
        
        Wydaje mi sie, ze tak jest. Zreszta te wlasnie elementy widac dokladnie na
        rentgenogramach.
        >
        
        > Chyba male nieporozumienie. Owszem, najwiecej ma do powiedzenia o str. 2-rz.
        > danej pozycji lokalna podsekwencja z jej otoczenia. Ale tylko w 70% (jak sugeru
        > je skutecznosc opartych na lokalnej info algorytmow). W pozostalych 30%
        > wplywaja na str. 2-rz. rozpatrywanej pozycji najprawdopodobniej jakies
        > podsekwencje znacznie oddalone, np. z drugiego konca calej sekwencji. W pewnym
        > artykule wyczytalem hipoteze, ze calkiem odlegle podsekwencje (motywy), pozniej
        > do siebie "przylgna", bo pasuja do siebie jak ulal (w danym sensie).
        > Czy jestes wrogiem hipotezy o globalnych oddzialywaniach? (Moj potencjalny
        > recenzent jest tego zwolennikiem.)
        
        Punkt dla Ciebie. A nawet dwa punkty. Dokladnie.
        
        >
        > > Kolega nazywa sie Jacek Leluk, kiedys Instytut Biochemii Uniwersytetu
        > > Wroclawskiego, co robi teraz - nie wiem.
        >
        > Bardzo dziekuje! Sprobuje poszukac w Internecie. Czy Twoj kolega jest autorem
        > tego algorytmu (potrzebne mi to do szukania)?
        
        Uzywal algorytmu Lima (niezbyt popularnego, ale twierdzil, ze jest b. dobry).
        Poza tym ostatnio widzialem go 7 lat temu, wiec nie wiem czy sie posunal w
        pracach, a raczej czy sie w ogole posunal - byl postacia, delikatnie mowiac -
        nitypowa i nietuzinkowa.
        >
        > No dobra, znowu moja niescislosc. Moze blizej prawdy jest powiedziec:
        > uklad srodowisko+ulozenie przestrzenne aminokwasow zwiazanych ze soba sekwencja
        > stanowia dynamiczny uklad chaotyczny.
        
        OK. Wiecej nacisku na dynamiczny, mniej na chaotyczny.
        >
        > Sekwencja jest niezmienna, ale ulozenie przestrzenne aminokwasow podczas proces
        > u zwijania - tak. Sekwencja i srodowisko, bardziej ogolnie, mozemy potraktowac
        > jako osadzone w pewnej przestrzeni roznych sekwencji i srodowisk i dalej
        > rozpatrywac
        > ewolucje ukladu przy zalozeniu stalosci tych 2 parametrow: sekwencji i
        > srodowiska. Byc moze znowu popelnilem blad, czy takie okreslenie sklonny jestes
        > teraz zaakceptowac?
        
        Z przyjemnoscia. Ale srodowisko tez sie nieco zmienia, przynajmniej w niektorych
        przypadkach (raczej w wielu).
        
        >
        > Wygladaloby, ze ta "cala reszta" str. 3D to kandydatka, aby zalezec od globalny
        > ch
        > usytuowan posczegolnych podsekwencji (motywow - czy czegos nie pomylilem?).
        
        Powtorz to jeszcze raz w prostszych slowach - z rana jestem dosc tepy (po
        poludniu zreszta tez).
        
        Gość: tk Re: globalna info: interrakcja oddalonych motywow? IP: *.chem.kuleuven.ac.be 12.12.01, 12:06
        
        Tak zupelnie przy okazji, jaka literature (i ile!) zebrales do tej pory?
        Czytujesz J. Comput. Chem. (jak dla mnie wyjatkowo obrzydliwe czasopismo!)? Ze
        szczegolnym uwzglednieniem prac H.A. Scheragi. Wczoraj zapytalem komputer o
        prace ze slowem kluczowym "protein folding" - wyrzucilo jakies 1500, po
        zredukowaniu do "protein folding" + "theoretical or computational" dostalem
        jakies 270 za ostatnie 6 lat.
        
        Gość: Muzykant szukanie publikacji... IP: *.chello.pl 12.12.01, 16:35
        
        Gość portalu: tk napisał(a):
        > Tak zupelnie przy okazji, jaka literature (i ile!) zebrales do tej pory?
        
        Gdy odwiedzam biblioteke instytutu z ktorym wspopracuje to wyszukuje artykuly na
        interesujacy mnie temat w roznych czasopismach poswieconych bioinformatyce i
        okolicy, jak "J. Of Theoretical Biology", "Computational
        Biology", "Proteins", "Protein Science" i inne "Journal Of ..." (mam nadzieje, ze
        nie przekrecilem ktoregos tytulu).
        
        Jednak przyznam, ze dawno tego nie robilem i raczej szukam publikacji w sieci.
        
        > Czytujesz J. Comput. Chem. (jak dla mnie wyjatkowo obrzydliwe czasopismo!)?
        
        Byc moze kilka artykulow z tego pisma przestudiowalem, m.in. utkwil mi w pamieci
        art. o znajdywaniu tego ktore parametry czasteczek aminokwasow sa najistotniejsze
        na podstawie maxymalizowania korelacji w wielu sekwencjach bialkowych...
        
        > Wczoraj zapytalem komputer o prace ze slowem kluczowym (...)
        > dostalem jakies 270 za ostatnie 6 lat.
        
        Tak, ale ja poszukuje tu, na niniejszym forum, mozliwosci wymiany pogladow a
        nawet konstruktywnego poprzekomarzania sie, abym, poprzez dodanie nieco emocji,
        mogl sie troche wytracic ze stagnacji w jaka ostatnio popadlem.
        Poza tym wiele informacji moze oznaczac balagan w ktorym szanse przetrwania
        zwieksza jakas zewnetrzna sugestia...
Gość: Muzykant jak zebrac info o calej sekwencji (globalna)? IP: *.chello.pl 11.12.01, 20:08

Gość portalu: wali7 napisał(a):

"Myslę, że w modelowaniu możnaby posłużyć się znanym algorytmem wyszukiwania
okreslonych sekwencji hydrofobowych aminokwasów w celu wyszukania struktur
drugorzędowych..."

Skutecznosc takich algorytmow jest ograniczona (ponizej 80%), mimo ze
wykorzystuje sie (grupuje sie aminokwasy ze wzgledu na) nie tylko wlasnosci
hydrobowe, ale tez inne parametry molekul aminkwasow.
Ale, przede wszystkim, algorytmy takie wykorzystuja jedynie lokalne podsekwencje,
czyli fragment sekwencji z bezposredniego sasiedztwa danego aminokwasu - pozycji
calej sekwencji - dla wyznaczenia jego przynaleznosci do danego typu struktury
drugorzedowej. Tutaj co niektorzy upatruja ograniczona skutecznosc (ok. 70%)
przewidywania: do wiekszej skutecznosci potrzebne jest branie calosciowej
(globalnej), a nie fragmentarycznej, iformacji o sekwencji aminokwasow!
Bierze sie pod uwage kazdorazowo podsekwencje o stalej, stosunkowo malej
dlugosci, z powodu banalnych ograniczen czysto technicznej natury (jak tutaj
trudno oprzec sie wrazeniu). Po prostu stosunkowo latwo skonstruowac
jadnokierunkowa siec neuronowa (albo cos podobnego) o stalej ilosci (np. 30)
wejsc stanowiacych "okno", przez ktore widac lokalna podsekwencje.

Sztuka sie zaczyna gdy sprobujemy zabrac informacje o calej sekwencji -
strukturze pierwszorzedowej calego bialka, ktorej dlugosc moze wynosic zarowno 50
pozycji, jak i 800 pozycji aminokwasow. Oraz zapisania takiej zmiennej rozmiarowo
informacji w miejcu znacznie bardziej stalym, w np. 3 zmiennych, latwym do
dalszego przetworzenia.
Jak juz napisalem poprzednio, byla proba dokonania tego poprzez skanowanie
sekwencji "od poczatku do konca" przez tzw. automat z pamiecia, ktory dzieki
zmiennym wewnetrznym spietym petla sprzezenia zwrotnego, iteracyjnie zbiera
historie widzianej po drodze sekwencji - wlasnie w tych zmiennych. Jednym z
istotnych bledow takiego podejscia jest sztuczne wyroznienie "poczatku" i "konca"
co daje male prawdopodobienstwo, iz wszystkie pozycje zostana uwzglednione jako
potencjalnie majace takie samo znaczenie (np. te z "poczatku" historii moga miec
tendencje do bycia "zapominanym").
Dlatego zadalem tu pytanie: JAK DOSKONALE MOZNA ZEBRAC INFORMACJE O CALEJ
SEKWENCJI roznej dlugosci? Prosze o SZALONE POMYSLY! Prosze o wziecie udzialu w
BURZY MOZGOW! Z ewentualnych efektow takiej wymiany mysli ja osobiscie mialbym
nadzieje skorzystac, o czym uczciwie uprzedzam. Jednak mam wrazenie, ze wiele
innych osob najprawdopodobniej rowniez mogloby odniesc pewna korzysc!

"...a sieć neuronową wykorzystać w celu przewidzenia konformacji struktury
trzeciorzędowej"

Ten sposob, "structure to structure NN", juz byl proponowany (nie pamietam w tej
chwili gdzie dokladnie), lecz tez bez istotnego powodzenia. Ale dopoki
skutecznosc przewidywania str. 2-rz. bedzie ukladac sie w okolicach 70%, nie
mozna tego wykorzystac jako polproduktu-bazy do przewidywania czegos co jest
naprawde o wiele powazniejszym problemem (chaotycznym-super wrazliwym na warunki
poczatkowe)!

Z powazaniem
Janek Muzykant
- Gość: wali7 Re: jak zebrac info o calej sekwencji (globalna)? IP: *.wola-justowska.sdi.tpnet.pl 12.12.01, 10:38
  
  Skoro pomysły mogą być "szalone" - nie ma sprawy. Ja nie siedzę w temacie tak bardzo jat Tk,
  niestety od zajęcia się doktoratem nie mam czasu na interesujące mnie niegdys zajęcia z zakresu
  modelowania dynamiki molekularnej białek, stąd moje sugestie możesz spokojnie traktować jako
  uwagi półlaika.
  Jak rozumiem, masz okno wejsciowe sieci powiedzmy 30 bramkowe. Skanujesz całą strukturę, i
  używasz sprzężeń zwrotnych co pozwala ci zachować informacje o wczesniejszych sekwencjach.
  Taka
  struktura sieci zapewne jest podatna na pojawienie się szkodliwych sprzężeń np. oscylacji,
  więc bardzo ważne jest zapewnienie optymalnej geometrii sieci. Jaka jest przyczyna niemożnosci
  zastosowania większej sieci? Szybkosć procesora? Ilosć pamięci? Jesli tak, to może jednak
  wyróżnienie sekwencji o konformacjach 2 rzędowych i zastąpienie ich stosownym identyfikatorem,
  czy
  raczej jednym z identyfikatorów zależnych od długosci tej sekwencji mogłoby znacząco zmniejszyć
  ilosć przetwarzanych danych bez straty dokładnosci. Zyskałbys możliwosć analizy całej struktury
  równolegle, co powinno dać znacznie większą sprawnosć przetwarzania i pojemnosć informacyjną
  sieci.
  Śledząc dyskusję jaką toczyłes z Tk zauważyłem, że masz wątpliwosci co do istnienia struktury
  drugorzędowej, poza kartką papieru oczywiscie. Struktury 2 rzędowe jak najbardziej istnieją, są to z
  reguły duże motywy, b. istotne dla całosci konformacji np. alfa helisy stanowią b. cząsto struktury
  zakotwiczające w błonie lipidowej - receptory białek G składają się zawsze z 7 struktur alfa
  helikalnych
  ułożonych równolegle do siebie i zakotwiczonych w błonie. Elementy stabilizujące strukturę 3
  rzędową
  (np. mostki S-S) z reguły stabilizują duże struktury 2 rzędu.
  Ostatnia sprawa: mógłbys mi podać garsć literatury z zakresu budowy sieci neuronowych, interesuje
  mnie to zagadnienie w związku z zupełnie innym projektem (nie związanym z białkami, niestety). Z
  góry dziękuję.
  Pozdrawiam
  - Gość: tk Re: jak zebrac info o calej sekwencji (globalna)? IP: *.chem.kuleuven.ac.be 12.12.01, 11:40
    
    Jak napisalem gdzies u gory, ja tez nie siedze w tym temacie, wiec nie
    dowartosciowuj mnie, prosze. Tym niemniej dziekuje za wsparcie w sprawie
    struktury 2-rzedowej.
    
    tk
  - Gość: Muzykant Re: literatura na temat sieci neuronowych IP: *.chello.pl 12.12.01, 17:24
    
    Gość portalu: wali7 napisał(a):
    > Ostatnia sprawa: mógłbys mi podać garsć literatury z zakresu budowy
    > sieci neuronowych
    
    Tejze literatury jest cala masa!
    W Internecie znajdziesz setki tysiecy prac na haslo "Neural Network" bowiem temat
    juz dawno niesamowicie zyskal na popularnosci a i same "sieci neuronowe" to
    bardzo szeroka dziedzina. Jest ich chyba blisko setka roznych odmian, typow i
    wariacji.
    Napisz wiec, co Cie dokladnie interesuje to moze Ci podsune jakis link.
    
    Bo jesli chodzi o ogolne wprowadzenie, to wystarczy udac sie do jakiejs ksiegarni
    naukowej i z pewnoscia cos sie tam znajdzie. Ja na przyklad zaczynalem od ksiazki
    Stanislawa Osowskiego "Sieci Neuronowe w ujeciu algorytmicznym".
    Ponadto wiele portali dedykowanych temu tematowi oferuje lagodne wprowadzenie i
    linki.
    Zobacz moze to FAQ:
    ftp://ftp.sas.com/pub/neural/FAQ.html
    albo wstepy:
    www.cs.stir.ac.uk/~lss/NNIntro/InvSlides.html
    www.neurocomputing.org/History/history.html
    strony International Neural Network Society:
    www.inns.org/
    i innych podobnych:
    www.loria.fr/equipes/rfia/cortex/
    vv.carleton.ca/~neil/neural/
    ale to sa tylko pierwsze lepsze przyklady z brzegu.
    
    W sumie to dzikeuje za pytanie, bo przy okazji natknalem sie na portale gdzie
    bede mogl znalezc cos inspirujacego dla siebie:
    www.geocities.com/sumeet_gupta/neural.html
    www.knowledgestorm.com/default.php
    
    Pozdrawiam

Najnowsze z forum Nauka

Zaloguj się