Новый алгоритм для оценки достоверности статей Wikipedia

Опубликовано: 5 ноября 2013 г., вторник

Новый алгоритм оценки статей Wikipedia повысит достоверность статей для читателей и поможет редакторам сфокусироваться на материалах, которые требуют правки и доработки.

В базе свободной энциклопедии присутствует огромное количество статей более чем на 200 языках. Однако качество статей весьма разнится: наряду с информативными и полезными статьями присутствуют поверхностные и даже дезинформирующие. Посетитель сайта не всегда может быть уверен в достоверности данной статьи в Wikipedia.

Разработчики Сиангйю Цинь (Xiangju Qin) и Падрэг Каннигем (Pádraig Cunningham) из Университета Дублина представили алгоритм, позволяющий оценить статью Wikipedia на основании авторитетности редакторов и продолжительности «жизни» их правок. Проблему вандализма исследователи обошли, проигнорировав в своих расчетах правки, которые вносили анонимные редакторы. Авторитетность авторов алгоритм оценивает не только по продолжительности пребывания в сообществе, но также по количеству связей с сообществом, так как замечено, что наибольший вклад в создание качественных статей вносят именно активные участники сообщества.

Алгоритм был протестирован на 9,000 статей Wikipedia. По словам авторов: «Статьи с со значительным вкладом авторитетных авторов обычно имеют высокое качество, также эти статьи, в общем, формируют больше взаимодействий и связей между авторами».

Источник: searchengines.ru
Копировать, распространять, публиковать информацию портала News.lt без письменного согласия редакции запрещено.

Комментарии Facebook

Новый комментарий


Captcha

Четверть Internet – зомби?

В настоящее время к Internet подключены более 600 млн. компьютеров, из которых около 150 млн. могут быть участниками зомби-сетей дальше »

Баннеры сдают позиции в Рунете

В прошлом году в русском сегменте Сети контекстная реклама впервые по своему объему превысила так называемую медийную рекламу (баннеры, всплывающие окна и другие форматы). дальше »

Поисковик по краденым кредитным картам

Компания Trusted ID запустила поисковую службу Stolen ID Search, способную выяснить, используются ли в сети конкретные номера социального страхования и кредитных карт. дальше »

Домен Тувалу осваивают телевизионщики

В конце прошлого года компания Demand Media договорилась с компанией VeriSign заняться продвижением домена TV в качестве зоны для размещения видео дальше »

Еврокомиссия прогнозирует бум на рынке онлайновой продукции

В течение пяти лет рынок онлайновой продукции в Европейском союзе вырастет на 400 процентов. дальше »

В Second Life появится посольство Швеции

В виртуальном мире Second Life появится посольство вполне реальной Швеции дальше »

YouTube изгнал пирата Fox

YouTube заблокировал учетную запись пирата, выдачи которого требует кинокомпания 20th Century Fox через суд дальше »

«Рамблер-ТВ» закрывают?

Корпорация «Проф-Медиа», владеющая интернет-холдингом «Рамблер», окончательно решила закрыть телеканал «Рамблер-ТВ». дальше »

Сервис Google Video откажется от видеороликов

Представители компании Google объявили о грядущей смене концепции сервиса Google Video дальше »

Украденную кредитку можно найти в интернете

В США появился поисковик, который ищет информацию об использовании в Интернете определенных номеров кредитных карт, а также данных социального страхования граждан. дальше »