YAHOON VÄÄRINKÄYTTÖALGORITMI TOIMII 90% AJASTA

tietokonealgoritmien ohje

Yahoon uutisartikkeleissa on paljon epämiellyttäviä kommentteja, aivan kuten muualla Internetissä, joten Yahoo-tiimi päätti käyttää kommenttiosaansa kehittääksesi algoritmin, joka voisi tunnistaa pahimmat rikkojat. Heidän uusi väärinkäytösten havaitsemisalgoritmi toimii 90 prosenttia ajasta, mikä heidän mukaansa tekee siitä tehokkaamman kuin muiden organisaatioiden yritykset ottaa samanlaisia tekoja, ja sitä kuvataan merkittävänä askeleena eteenpäin alalla. 90 prosenttia tekee kuulostaa melko hyvältä, myönnän.

Langallinen raportoi, että Yahoo julkaisee myös ensimmäisen julkisesti saatavilla olevan kuratoidun tietokannan vihapuheista verkossa osana hanketta väärinkäytön torjumiseksi. Tämä tarkoittaa, että muut sivustot voivat käyttää Yahoon kommenttitietokantaa suunnitellakseen omat algoritminsa. Yahoon algoritmi kehitettiin koneoppimisen ja käyttäjien ilmoittamien tietojen perusteella heidän kommenttiosioistaan.

Kaikkien kommentteja moderoivien algoritmien vaikein osa on käsitellä vääriä positiivisia tuloksia. Monet väärinkäyttöä havaitsevat algoritmit etsivät tiettyjä sanoja tai lauseita, kuten hämmennyksiä tai yleisiä loukkauksia, ja merkitsevät kommentit automaattisesti maltillisiksi. Tämä johtaa kuitenkin siihen, että kommentit merkitään, vaikka ne viittaavatkin sluriin esimerkiksi sanomalla, että se ei ole tarkoituksenmukaista, tai jos kommentti on sarkastinen peikko jäljitelmä. Yahoon algoritmi pystyy ilmeisesti havaitsemaan tietyt puhemallit, ja se on suunniteltu erottamaan vitsisarkasmin ja todellisen väärinkäytön välillä. (Tietysti, jos hilpeä kommenttisi ei ole erotettavissa todellisesta väärinkäytöstä, olen varma, että algoritmi merkitsee sen edelleen, mutta en voi sanoa varmasti, kuinka kyseinen tekoälyn osa toimii.)

Yahoo käytti koulutettuja kommenttimoderaattoreita auttamaan algoritmin täydentämisessä, ja he maksoivat myös joillekin kouluttamattomille moderaattoreille, ja he havaitsivat, että koulutetut moderaattorit osallistuivat paljon paremmin selvittämään, mitkä kommentit olivat sopivia (eräänlainen ei järkevää, mutta hei). Tekoälyn luomisen aikana Yahoo havaitsi, että näiden koulutettujen ihmisen valvojien työ oli välttämätöntä algoritmin tehokkuuden ylläpitämiseksi ja sen havaitsemistekniikoiden parantamiseksi.

Tietysti, algoritmeilla on edelleen ennakkoluuloja , mikä edellyttäisi (toivottavasti monipuolista) ihmismoderaattoriryhmää jatkamaan kommenttien luokittelussa käytettyjen menetelmien toistamista. Kuulostaa kovalta työltä, mutta ainakin Yahoo ymmärtää nyt koulutuksen tärkeyden ja arvostaa sekä hyvin koulutettujen ihmisvalvojien että uuden tekoälykollegan rooleja.