Problem Scunthorpe'a - Scunthorpe problem

Przykład problemu Scunthorpe w Wikipedii z powodu dopasowania wyrażenia regularnego

Problemem Scunthorpe jest niezamierzone blokowanie stron internetowych, e-maili, postów lub wyników wyszukiwania przez filtr spamu lub wyszukiwarki , ponieważ ich tekst zawiera łańcuch (lub podciągu ) listów, które wydają się mieć obsceniczne lub w inny sposób niedopuszczalne znaczenie. Najczęściej wymieniane są nazwy, skróty i terminy techniczne, których dotyczy problem.

Problem pojawia się, ponieważ komputery mogą łatwo identyfikować ciągi tekstu w dokumencie, ale interpretacja tego rodzaju słów wymaga znacznej umiejętności interpretowania szerokiego zakresu kontekstów, prawdopodobnie w wielu kulturach, co jest niezwykle trudnym zadaniem. W rezultacie ogólne zasady blokowania mogą skutkować fałszywymi alarmami wpływającymi na niewinne frazy.

Pochodzenie i historia

Problem został nazwany po incydencie z 1996 roku, w którym filtr wulgaryzmów AOL uniemożliwił mieszkańcom miasta Scunthorpe w północnym Lincolnshire w Anglii tworzenie kont w AOL, ponieważ nazwa miasta zawiera podłańcuch „ pizda ”. We wczesnych 2000s, Google „s opt-in SafeSearch filtry również wpływ na miasto, uniemożliwiając ludziom poszukiwanie lokalnych firm lub adresów URL, które obejmowały Scunthorpe w ich nazwach.

Inne przykłady

Błędne decyzje podejmowane przez filtry nieprzyzwoitości obejmują:

Odrzucone nazwy domen internetowych i rejestracje kont

  • W kwietniu 1998, Jeff Gold próbował zarejestrować nazwę domeny shitakemushrooms.com , ale z powodu gówna z podłańcuchami został zablokowany przez filtr InterNIC zakazujący " siedmiu nieprzyzwoitych słów ". ( Shiitake pochodzi od japońskiej nazwy jadalnego grzyba Lentinula edodes .)
  • W 2000 roku kanadyjska telewizja informacyjna o oprogramowaniu do filtrowania stron internetowych odkryła, że ​​strona internetowa społeczności miejskiej Montrealu (w języku francuskim Communauté urbaine de Montréal) została całkowicie zablokowana, ponieważ nazwa domeny to francuski akronim CUM (www.cum.qc.ca). ); „ cum ” (między innymi znaczeniami) to angielski slang dla nasienia .
  • W lutym 2004 roku w Szkocji Craig Cockburn poinformował, że nie może używać swojego nazwiska (wymawianego „Coburn”) w Hotmailu . Osobno miał problemy z pocztą e-mail w miejscu pracy, ponieważ jego tytuł zawodowy, specjalista ds. oprogramowania , zawierał podłańcuch Cialis , lek na zaburzenia erekcji, powszechnie wymieniany w wiadomościach spamowych . Hotmail początkowo kazał mu przeliterować swoje imię C0ckburn (z zerem zamiast litery „o”), ale później odwrócił zakaz. W 2010 roku miał podobny problem z rejestracją na stronie BBC, gdzie ponownie pierwsze cztery znaki jego nazwiska spowodowały problem z filtrem treści.
  • W lutym 2006 roku Linda Callahan początkowo nie mogła zarejestrować swojego nazwiska w Yahoo! jako adres e-mail, ponieważ zawierał podciąg Allah . Wieśniak! później odwrócił zakaz.
  • W lipcu 2008 r. dr Herman I. Libshitz nie mógł zarejestrować w Verizon adresu e-mail zawierającego jego imię, ponieważ jego nazwisko zawierało podciąg gówniany , a Verizon początkowo odrzucił jego prośbę o wyjątek. W kolejnym oświadczeniu rzeczniczka Verizon przeprosiła za niezatwierdzenie jego pożądanego adresu e-mail.
  • W sierpniu 2018 roku Natalie Weiner poinformowała w mediach społecznościowych, że nie była w stanie założyć dla siebie konta na stronie internetowej, ponieważ jej nazwisko jest również słowem używanym jako slang na penisa . Doniesiono, że „setki” osób odpowiedziało, że to również ich dotyczyło. Nazwiska tych, którzy odpowiadali, to Ben Schmuck (nazwisko to w jidysz słowo oznaczające „penisa”) oraz Arun Dikshit (nazwisko to sanskryt dla tego, kto naucza lub dostarcza wiedzy, zawierającej podciąg gówno ). W artykułach na ten temat stwierdzono, że jest to powszechny i ​​niezwykle trudny problem techniczny, dla którego nie ma obecnie dostępnego solidnego rozwiązania.

Zablokowane wyszukiwania w sieci

  • W miesiącach poprzedzających styczeń 1996 r. niektóre wyszukiwania w Internecie dotyczące Super Bowl XXX były filtrowane, ponieważ rzymska cyfra oznaczająca grę i witrynę (XXX) jest również używana do oznaczania pornografii .
  • Gareth Roelofse, projektant stron internetowych dla RomansInSussex.com , zauważył w 2004 r.: „Znaleźliśmy wiele internetowych stacji bibliotecznych, sieci szkół i kafejek internetowych, które blokują strony ze słowem „seks” w nazwie domeny. To było wyzwanie dla RomansInSussex.co. uk, ponieważ jego grupą docelową są dzieci w wieku szkolnym”.
  • W 2008 r. filtr darmowej usługi bezprzewodowej w mieście Whakatane w Nowej Zelandii zablokował wyszukiwanie własnej nazwy miasta, ponieważ analiza fonetyczna filtra uznała, że ​​„whak” brzmi jak cholera ; nazwa miasta jest w Maorysów, aw języku Maorysów „wh” jest najczęściej wymawiane jako „f”. Miasto następnie umieściło nazwę miasta na białej liście filtra .
  • W lipcu 2011 r. wyszukiwanie w Internecie nazwiska Jiang zostało zablokowane w związku z twierdzeniami na stronie mikroblogowej Sina Weibo, że zmarł były sekretarz generalny Komunistycznej Partii Chin (KPCh) Jiang Zemin . Ponieważ słowo „Jiang” oznaczające „rzeka” jest napisane tym samym chińskim znakiem (江), wyszukiwania związane z rzekami, w tym Jangcy ( Cháng Jiāng ), dały komunikat: „Zgodnie z odpowiednimi przepisami ustawowymi, wykonawczymi i politycznymi wyniki nie można wyświetlić tego wyszukiwania."
  • W lutym 2018 r. wyszukiwanie w Internecie na platformie zakupowej Google zostało zablokowane dla takich przedmiotów, jak pistolety do kleju , Guns N' Roses i wino Burgundy po tym, jak Google pospiesznie załatał swój system wyszukiwania, który wyświetlał wyniki dotyczące broni i akcesoriów, które naruszały określone zasady Google.

Zablokowane e-maile

  • W 2001 roku Yahoo! Mail wprowadził filtr poczty e-mail, który automatycznie zastępował ciągi związane z JavaScript wersjami alternatywnymi, aby zapobiec możliwości cross-site scripting w wiadomości HTML . Filtr rozdzieli wyrazy „ JavaScript ”, „ JScript ”, „ VBScript ” i „ LiveScript ”; i zastąpiła " eval ", " mocha " i " wyrażenie " podobnymi, ale nie do końca synonimami, odpowiednio terminami " recenzja ", " espresso " i " oświadczenie ". Przy pisaniu filtrów brano pod uwagę założenia: nie podjęto żadnych prób ograniczania zastępowania ciągów do anchor scriptsekcji i atrybutów ani respektowania granic słów, na wypadek gdyby pozostawiło to otwarte luki. Spowodowało to takie błędy jak medireview w miejsce średniowiecznego .
  • W lutym 2003 roku, posłowie w brytyjskiej Izbie Gmin, okazało się, że nowy filtr antyspamowy blokuje e-maile do nich. Blokował e-maile zawierające odniesienia do ustawy o przestępstwach seksualnych, która była wówczas przedmiotem debaty, a także niektóre wiadomości dotyczące dokumentu konsultacyjnego Liberalnych Demokratów na temat cenzury. Blokował również e-maile wysyłane w języku walijskim, ponieważ nie rozpoznawał języka.
  • W październiku 2004 roku poinformowano, że Horniman Museum w Londynie nie otrzymało części wiadomości e-mail, ponieważ filtry błędnie potraktowały jego nazwę jako wersję słowa horny man . Horny jest powszechnym slangowym terminem oznaczającym „podniecenie seksualne lub podniecenie”.
  • Problemy mogą pojawić się ze słowami socjalizm , socjalista i specjalista, ponieważ zawierają one podłańcuch Cialis . Zablokowanie słowa „ specjalista” może spowodować zablokowanie e-mailem życiorysów i życiorysów oraz innych materiałów, w tym opisów stanowisk.

Zablokowane dla słów o wielu znaczeniach

  • W październiku 2004 r. e-maile reklamujące pantomimę Dick Whittington wysłane przez nauczyciela z Norwich w Wielkiej Brytanii zostały zablokowane przez szkolne komputery z powodu używania imienia Dick , używanego czasem jako slang na penisa .
  • W maju 2006 r. mężczyzna z Manchesteru w Wielkiej Brytanii odkrył, że e-maile, które napisał do swojej rady lokalnej, ze skargą na wniosek o planowanie, zostały zablokowane, ponieważ zawierały słowo „ wzniesienie” w odniesieniu do konstrukcji.
  • Zablokowane e-maile i wyszukiwania w sieci związane z magazynem The Beaver z siedzibą w Winnipeg spowodowały, że wydawca zmienił nazwę na Canada's History w 2010 roku, po 89 latach publikacji. Wydawnictwo Deborah Morrison skomentowała: „W 1920 r . Bóbr był idealną nazwą. I chociaż inne znaczenie [ srom ] nie jest niczym nowym, wraz z rozwojem Internetu jego dwuznaczność zaczęła stanowić zupełnie nowe wyzwanie. przeszkoda w naszym rozwoju”.
  • W czerwcu 2010 r. Twitter zablokował użytkownika z Luksemburga 29 minut po tym, jak otworzył on swoje konto i opublikował swój pierwszy tweet. Tweet brzmiał: „Wreszcie! Para wielkich cycków (Parus major) wprowadziła się do mojej ptaszarni!” Pomimo umieszczenia łacińskiej nazwy, aby wskazać, że tweet dotyczył ptaków, wszelkie próby odblokowania konta poszły na marne.
  • W 2011 roku radnym w Dudley znaleźć e-mail na pozycji wulgaryzmów przez oprogramowanie zabezpieczające jego Rada po wspomnieć czarne Kraj danie, pedałów (rodzaj Klops , ale także pejoratywne określenie dla homoseksualnych mężczyzn).
  • E-maile dla mieszkańców Penistone w South Yorkshire zostały zablokowane, ponieważ nazwa miasta zawiera fragment penisa .
  • Lightwater w Surrey ucierpiało podobnie, ponieważ jego nazwa zawiera cioto podłańcuchowe .
  • Mieszkańcy Clitheroe ( Lancashire , Anglia) wielokrotnie doświadczali niedogodności, ponieważ nazwa ich miasta zawiera podciąg clit , co jest skrótem od „ clitoris ”.
  • Życiorysy zawierające odniesienia do ukończenia studiów z wyróżnieniem łacińskim, takie jak cum laude , summa cum laude i magna cum laude , zostały zablokowane przez filtry antyspamowe z powodu włączenia słowa cum , które po łacinie oznacza with (w tym użyciu), ale jest czasami używane jako slang na nasienie lub wytrysk w języku angielskim.

Artykuły z wiadomościami

  • W czerwcu 2008 r. serwis informacyjny prowadzony przez anty- LGBT American Family Association przefiltrował artykuł Associated Press na temat sprintera Tysona Gaya , zastępując „gej” słowem „ homoseksualny ”, czyniąc jego nazwisko „Tyson Homosexual”. Ta sama funkcja wcześniej zmieniła imię koszykarza Rudy'ego Gay'a na "Rudy Homosexual".
  • Czasami byłego wiceprezydenta Dicka Cheneya w artykułach filtrowano jako „Penis Cheney” lub „Weiner Cheney” ze względu na użycie imienia Dick , czasami używanego jako slang na określenie penisa .
  • Słowo lub ciąg „ass” można zastąpić słowem „tyłek”, w wyniku czego „clbuttic” oznacza „klasyczny”, „buttignment” oznacza „przypisanie” i „buttbuttinate” oznacza „zabójstwo”.

Inne

  • W 2008 roku Microsoft potwierdził, że jego polityka zapobiegania używaniu słów odnoszących się do orientacji seksualnej oznaczała, że ​​nazwisko Richarda Gaywooda zostało uznane za obraźliwe i nie mogło zostać użyte w jego tagu gracza ani w polu „Prawdziwe imię” w jego biografii.
  • W 2011 roku w grach wideo Pokémon Black and White , Pokémon Cofagrigus nie mógł być sprzedawany online innym graczom bez pseudonimu, ponieważ jego nazwa gatunku zawierała podłańcuch pejoratywnego pedału . Od tego czasu system został zaktualizowany, aby umożliwić handel Pokémonami bez pseudonimów. Ten sam problem występowały Nosepass i Probopass ze względu na ich umieszczenie podciągu ośle .
  • W listopadzie 2013 roku Facebook tymczasowo zablokował brytyjskim użytkownikom używanie pejoratywnego pedału w odniesieniu do tradycyjnej potrawy o tej samej nazwie .
  • W styczniu 2014 r. pliki używane w grze online League of Legends zostały podobno zablokowane przez niektóre filtry brytyjskich dostawców usług internetowych ze względu na nazwy „VarusExpirationTimer.luaobj” i „XerathMageChainsExtended.luaobj”, które zawierają litery s , e oraz x . Zostało to później poprawione.
  • W maju 2018 r. strona sklepu spożywczego Publix nie pozwoliła na zamówienie ciasta zawierającego łacińską frazę summa cum laude . Klient próbował rozwiązać problem, dołączając specjalne instrukcje, ale i tak skończył z ciastem z napisem „Summa --- Laude”.
  • W maju 2020 r., pomimo szeroko zakrojonej analizy mediów, niektóre hashtagi bezpośrednio odnoszące się do brytyjskiego doradcy politycznego Dominica Cummingsa nie były w stanie wypromować się na Twitterze, ponieważ podłańcuch spermy uruchomił filtr antyporno.
  • W październiku 2020 r. filtr wulgaryzmów na Twitterze zakazał słów „kość”, „ łonowe ” i „strumień” na konferencji paleontologicznej .
  • W styczniu 2021 r. Facebook przeprosił za wyciszanie i blokowanie użytkowników po błędnym oznaczeniu charakterystycznego dla Devon Plymouth Hoe jako mizoginicznego.
  • W kwietniu 2021 r. zlikwidowano oficjalną stronę na Facebooku francuskiej gminy Bitche . W odpowiedzi urzędnicy gminy utworzyli nową stronę z kodem pocztowym Mairie 57230 . Facebook później przeprosił i przywrócił oryginalną stronę. Jako środek ostrożności, urzędnicy Rohrbach-lès-Bitche zmienili nazwę swojej strony na Facebooku Ville de Rohrbach .

Zobacz też

Bibliografia