Новый алгоритм для оценки достоверности статей Wikipedia

Опубликовано: 5 ноября 2013 г., вторник

Новый алгоритм оценки статей Wikipedia повысит достоверность статей для читателей и поможет редакторам сфокусироваться на материалах, которые требуют правки и доработки.

В базе свободной энциклопедии присутствует огромное количество статей более чем на 200 языках. Однако качество статей весьма разнится: наряду с информативными и полезными статьями присутствуют поверхностные и даже дезинформирующие. Посетитель сайта не всегда может быть уверен в достоверности данной статьи в Wikipedia.

Разработчики Сиангйю Цинь (Xiangju Qin) и Падрэг Каннигем (Pádraig Cunningham) из Университета Дублина представили алгоритм, позволяющий оценить статью Wikipedia на основании авторитетности редакторов и продолжительности «жизни» их правок. Проблему вандализма исследователи обошли, проигнорировав в своих расчетах правки, которые вносили анонимные редакторы. Авторитетность авторов алгоритм оценивает не только по продолжительности пребывания в сообществе, но также по количеству связей с сообществом, так как замечено, что наибольший вклад в создание качественных статей вносят именно активные участники сообщества.

Алгоритм был протестирован на 9,000 статей Wikipedia. По словам авторов: «Статьи с со значительным вкладом авторитетных авторов обычно имеют высокое качество, также эти статьи, в общем, формируют больше взаимодействий и связей между авторами».

Источник: searchengines.ru
Копировать, распространять, публиковать информацию портала News.lt без письменного согласия редакции запрещено.

Комментарии Facebook

Новый комментарий


Captcha

Запретили телеканал «Беларусь-ТВ»

Московский кабельный оператор отказался транслировать «Беларусь-ТВ». дальше »

Китайцы тратят на Интернет более 10% от зарплаты

Ежемесячные расходы жителей Китая на пользование Интернетом составляют около 83 юаней ($10,8 ) дальше »

Весенние забавы хакеров

IT-специалистам газеты "Коммерсант" удалось справиться с хакерской атакой дальше »

„Delfis“ vs „Delfi“: невзорвавшаяся бомба

Сегодня в 12 час. в пресс-центре ELTA состоялась пресс-конференция, на которой бомба нового литовского портала Delfis.lt так и не взорвалась. дальше »

31% угроз, обнаруженных в первом квартале 2007 года – трояны

На минувшей неделе в отчете PandaLabs рассматриваются: интернет-червь Ridnu.С и трояны Evilx.A и Clagge.G дальше »

Проект «Интернет-ЭКСПО»

Из разных концов мира можно будет наблюдать за Всемирной выставкой ЭКСПО-2010 по Интернету дальше »

Итоги Лиссабонской конференции ICANN

30 марта в Лиссабоне завершила свою работу 28-ая международная конференция ICANN дальше »

Все дороже и дороже...

Вслед за доменами в зонах COM и NET подорожают имена в зонах ORG и INFO дальше »

Google открыла сервис Web History

Компания Google открыла новый онлайновый сервис, получивший название Web History дальше »

Взломали сайт правящей партии Эстонии

Хакеры в пятницу взломали интернет-сайт правящей Реформистской партии, председателем которой является премьер-министр Эстонии Андрус Ансип. дальше »