Dodaj do ulubionych

E! Stażyści!

27.09.17, 06:55
Wiem że Agora wam nie płaci, ale moglibyście z łaski swojej napisać skrypt z automatu blokujący komentarze zawierające frazę:
"Znalazłem serwis z aukcjam"
Gość od wielu miesięcy (jeśli nie lat) spamuje wam pod wszystkimi tekstami a wy jesteście bezradni jak dzieci we mgle.
PS
A tak na poważnie to mogli byście rozwiązać ten problem globalnie.
Wystarczy że uruchomicie skrypt wyłapujący posty powtarzające się wielokrotnie w różnych miejscach portalu.
-
Ceterum censeo Russia delendam esse
Edytor zaawansowany
  • 27.09.17, 09:10
    wkkr:
    > Wiem że Agora wam nie płaci, ale moglibyście z łaski swojej napisać skrypt z
    > automatu blokujący komentarze zawierające frazę:
    > "Znalazłem serwis z aukcjam"

    Ten problem był już wiele razy poruszany, a admini twierdzą, że tego się nie da zrobić. Ponieważ jest to informatyczny absurd, opinia publiczna sądzi raczej, że z jakichś powodów admini nie chcą tego spamu zablokować. A dlaczego nie chcą -- to możemy tylko zgadywać.

    wkkr:
    > Ceterum censeo Russia delendam esse

    Łacina jest językiem fleksyjnym, tak jak polski, a nie jak niedorozwinięty gramatycznie angielski. W kostrukcji Accusativus cum infinitivo nie można biernika uprościć do mianownika. Tam musi być ,,Russiam''. Ale przecież nie musisz pisać po łacinie, o której coś słyszałeś; równie dobrze możesz się wypowiadać w języku polskim, który znasz.

    Swoją drogą mógłbyś już nie wypominać starożytnemu Rzymowi tego agresywnego durnia, Marka Porcjusza Katona, który bzdurzył o zniszczeniu Kartaginy, niezależnie od tego, o czym akurat toczyła się rozmowa. Każdy kraj ma swoje autystyczne dzieci, a w niektórych krajach, nie tylko w Rzymie, potrafią one zajść wysoko i ukształtować historię.

    - Stefan

    --
    Zwalczaj biurokrację!
  • 27.09.17, 09:56
    Mylisz się, w tym wypadku język jest równie istotny co treść bo wskazuje konkretne odwołanie kulturowe.
    PS
    A co do "m", masz racje, musi tam być.

    --
    Ceterum censeo Russia delendam esse
  • 27.09.17, 15:39
    wkkr:
    > A co do "m", masz racje, musi tam być.
    [...]
    > Ceterum censeo Russia delendam esse

    Musi, ale nadal go tam nie ma...

    wkkr:
    > Wykazałeś się kompletnym niezrozumieniem intencji Katona Starszego.

    Ty zaś wykazałeś się nadzrozumieniem intencji tego wojskowego głąba. Ale to dyskusja na inne forum...

    - Stefan

    --
    Zwalczaj biurokrację!
  • 28.09.17, 13:59
    Używać inwektyw to ja mogę na innym forum... w innym wątku.

    --
    Ceterum censeo Russia delendam esse
  • 27.09.17, 10:01
    Jeszcze jedno.
    Wykazałeś się kompletnym niezrozumieniem intencji Katona Starszego.

    --
    Ceterum censeo Russia delendam esse
  • 27.09.17, 14:52
    Takie blokady zapobiegają co najwyżej botom, a nie białkowym spamerom, którzy w każdej chwili mogą zmienić "znalazłem" na "tu macie", "serwis" na "portal", a aukcje na biddingi/zakupy itd. czyli dosłownie cokolwiek.
    Taki skrypt istnieje od zawsze. Jak fraza jest stała, to przynajmniej moderatorzy mogą łatwo i szybko namierzyć delikwenta, hurtowo go skasować i zablokować. Oczywiście do czasu powstania następnego konta. Bardzo chętnie wysłucham propozycji w jaki sposób zablokować białkowego spamera używającego zmiennego IP, który stosuje różne frazy i nieskończoną liczbę skracarek adresów. Oczywiście jednocześnie nie utrudniając życia normalnym użytkownikom. Wszystkie merytoryczne sugestie są bardzo mile widziane.
  • 27.09.17, 15:45
    marrant:
    > Wszystkie merytoryczne sugestie są bardzo mile widziane.

    Merytorycznych sugestii było już wiele, poszukaj sobie sama w archiwum. Ale zaciekawiła mnie nowa rzecz:

    marrant:
    > nie białkowym spamerom [...] białkowego spamera

    Tego wyrażenia nie znam, i Gógiel chyba też nie zna. Oczywiście nie sprawdziłem wszystkich 3610 trafień, ale te, które sprawdziłem, są albo o białku, albo o spamie, ale nigdy razem.

    Czy to jakiś Wasz redakcyjny slang?

    - Stefan

    --
    Zwalczaj biurokrację!
  • 28.09.17, 14:19
    Przecież ten sam tekst jest wklejany od co najmniej roku.....
    Poza tym to na pewno jest bot a nie człowiek.

    --
    Ceterum censeo Russia delendam esse
  • 28.09.17, 15:56
    To człowiek i nie używa tego samego tekstu. Używa podobnie brzmiącego tekstu.

    Jeżeli nie wierzycie mi na słowo, to proszę... Zablokowałam "Znalazłem serwis z aukcjam". Wieczorem będzie coś nowego.
  • 28.09.17, 16:27
    wieczorem=po 30 minutach
  • 29.09.17, 07:25
    Blokuj go aż mu się znudzi. Moim zdaniem to jest bot ale taki który informuje swojego "pana" o blokadzie.
    Blokujcie powtarzane posty, blokujcie nicki. W końcu mu się znudzi.
    PS
    A pozwać go nie możecie? Wyceńcie straty z powodu nielegalnej reklamy. Pozew cywilny o milion lub dwa na Agorze nei zrobi wrażenia ale taki gostek powinien sie przynajmniej przestraszyć. A nawet jeśli się nie przestraszy, to uprzykrzycie mu życie.

    --
    Ceterum censeo Russia delendam esse
  • 29.09.17, 10:37
    marrant:
    > to proszę... Zablokowałam "Znalazłem serwis z aukcjam". Wieczorem będzie
    > coś nowego.

    I o tym już mówiliśmy: lista fraz zakazanych to najbardziej prymitywny i nieskuteczny sposób blokowania spamera. Jednak to nie Ty masz walczyć ze spamerem, to jest robota dla informatyka a nie dla humanisty -- tylko trzeba mieć w zespole jakiegoś informatyka.

    Twój mózg bez trudu poznaje bez żadnej wątpliwości, że frazy
      Znalazłem serwis z aukcjam
      Zna,lazłem serws z aukcjam
      Znalazłem ser|wis z aucjam

      itp.
    oznaczają ten sam spam. Twój mózg nie robi tego przez porównywanie litera po literze z listą fraz zakazanych i nie da się wykiwać zmianą pojedynczej litery.

    Nie wszystko, co potrafi ludzki mózg, daje się wykonać przez software, ale to akurat się da. Np. (jak na pewno zauważyłaś) Google poprawnie rozpoznaje i poprawia takie drobne literówki. Robią to również powszechnie dostępne filtry antyspamowe. Ale trzeba zatrudnić jakiegoś informatyka.

    - Stefan

    --
    Zwalczaj biurokrację!
  • Gość: = IP: 134.30.7.* 28.10.17, 18:55
    W piewszym rzucie sprawdź co to wyrażenia regularne (regex).
    Wygląda jak zadanie domowe dla studenta.
  • 28.10.17, 19:31
    = :
    > W piewszym rzucie sprawdź co to wyrażenia regularne (regex).

    Nie, aż tak proste to nie jest. Napisz mi wzorzec regularny wychwytujący np. wszystkie warianty ortograficzne słowa ,,aukcja''; myślę, że bez trudu znajdę Ci do niego
        * albo słowo niewinne, niesłusznie wychwytywane przez Twój wzorzec (np. ,,kaucja'' albo ,,akacja'') czyli t.zw. false positive,
        * albo wariant niewychwytywany ale zrozumiały dla człowieka (np. ,,a!ukcja'' albo ,,ałkcja'').

    Lepsza tu już byłaby chociażby odległość Levenshteina. Chociaż to pojęcie pochodzi sprzed ponad pół wieku, to i tak działa precyzyjniej niż lista fraz zakazanych. Oczywiście istnieją metody nowsze i działające subtelniej niż odległość Levenshteina. Cały czas to głoszę: trzeba w końcu zatrudnić w Gazecie informatyka.

    - Stefan

    --
    Zwalczaj biurokrację!
  • 28.10.17, 21:37
    Gdybyście po latach nie zauważyli to jak się zablokuje "aukcję" i podobne, to ten spamer będzie używał synonimu, lub czegoś całkowicie innego. Chodzi o kliknięcie w link, a nie użycie konkretnego zwrotu. Póki ludzie będą się na to nabierali póty ten spam będzie występował.
  • 29.10.17, 12:03
    marrant:
    > ten spamer będzie używał synonimu, lub czegoś całkowicie innego

    Jeśli całkowicie przeredaguje tekst, to oczywiście sprawa będzie trudna. Ale on tego nie robi, bo nie ma potrzeby. On w jakieś miejsce swojego spamu losowo wtyka jakiś pojedynczy znaczek i Wasze filtry już się na to nabierają. A Ty jak przedwojenny patefon na porysowanej płycie w kółko powtarzasz, że wobec tego ,,nie da się nic zrobić''.

    Właśnie dostałaś dwie różne rady techniczne, jak jednak dałoby się osiągnąć znaczne utrudnienie życia spamerowi:
        * wyrażenia regularne,
        * odległość Levenshteina.
    Ja już wcześniej podawałem inną radę:
        * filtr Bayesa.
    To są sposoby proste, nie wymagające technik sztucznej inteligencji. Nie w stu procentach skuteczne, ale na tyle utrudniające zamieszczanie spamu, że może się ono przestać opłacać. Będzie już częściowym sukcesem, jeśli zmusicie go do ręcznego przeredagowywania tekstu spamu za każdym razem. Obecnie, żeby obejść Wasze śmieszne ,,zabezpieczenia'', wystarczy mu wstawić gdzieś losowy znak -- a to da się zrobić automatycznie, nawet bez zaglądania do tekstu.

    - Stefan

    --
    Zwalczaj biurokrację!

Popularne wątki

Nie pamiętasz hasła lub ?

Zapamiętaj mnie

Nie masz jeszcze konta? Zarejestruj się

Nakarm Pajacyka
Agora S.A. - wydawca portalu Gazeta.pl nie ponosi odpowiedzialności za treść wypowiedzi zamieszczanych przez użytkowników Forum. Osoby zamieszczające wypowiedzi naruszające prawo lub prawem chronione dobra osób trzecich mogą ponieść z tego tytułu odpowiedzialność karną lub cywilną. Regulamin.