Новый алгоритм для оценки достоверности статей Wikipedia

Опубликовано: 5 ноября 2013 г., вторник

Новый алгоритм оценки статей Wikipedia повысит достоверность статей для читателей и поможет редакторам сфокусироваться на материалах, которые требуют правки и доработки.

В базе свободной энциклопедии присутствует огромное количество статей более чем на 200 языках. Однако качество статей весьма разнится: наряду с информативными и полезными статьями присутствуют поверхностные и даже дезинформирующие. Посетитель сайта не всегда может быть уверен в достоверности данной статьи в Wikipedia.

Разработчики Сиангйю Цинь (Xiangju Qin) и Падрэг Каннигем (Pádraig Cunningham) из Университета Дублина представили алгоритм, позволяющий оценить статью Wikipedia на основании авторитетности редакторов и продолжительности «жизни» их правок. Проблему вандализма исследователи обошли, проигнорировав в своих расчетах правки, которые вносили анонимные редакторы. Авторитетность авторов алгоритм оценивает не только по продолжительности пребывания в сообществе, но также по количеству связей с сообществом, так как замечено, что наибольший вклад в создание качественных статей вносят именно активные участники сообщества.

Алгоритм был протестирован на 9,000 статей Wikipedia. По словам авторов: «Статьи с со значительным вкладом авторитетных авторов обычно имеют высокое качество, также эти статьи, в общем, формируют больше взаимодействий и связей между авторами».

Источник: searchengines.ru
Копировать, распространять, публиковать информацию портала News.lt без письменного согласия редакции запрещено.

Комментарии Facebook

Новый комментарий


Captcha

Quintura представила поисковик без порнографии

В канун праздника компания Quintura подготовила новогодний сюрприз и запустила новый сервис на английском языке дальше »

Сумма иска к AllOfMP3.com – $1,65 триллиона

Warner Bros., Sony BMG, Capitol Records и ряд других гигантов музыкальной индустрии требуют от россиян беспрецедентную компенсацию в размере 1,65 триллиона долларов дальше »

Виртуальная международная библиотекa

Открыта русская страница на сайте Международной библиотеки Стокгольма дальше »

США установит слежку из интернет-провайдерами

Администрация Дж. Буша будет отслеживать свободу доступа к Интернету и вести мониторинг за работой интернет-провайдеров в зарубежных странах. дальше »

В поиске Google чаще всего ищут новости о Пэрис Хилтон

Представители крупнейшей поисковой системы Google обнародовали рейтинг самых популярных запросов 2006 года. дальше »

За BitTorrent могут посадить

Апелляционный суд Гонконга отклонил жалобу на первый в истории обвинительный приговор по делу о закачке кинофильмов в Интернет с помощью пиринговой сети BitTorrent. дальше »

В зоне «.ru» зарегистрирован 700-тысячный домен

Российский регистратор доменных имен «Регтайм» сообщает о появлении в доменной зоне .RU 700-тысячного домена. дальше »

Водка за три миллиона

Российский миллиардер Рустам Тарико, владелец компании «Русский стандарт», приобрел доменное имя vodka.com за $3 млн. дальше »

Вирус Warezov устроил эпидемию через ICQ

Вчера большое количество пользователей сети Рунет получили по ICQ приглашение на сайт seruijingandeshijinpos.com. дальше »

Demand Media раскрутит домен TV

Компания Demand Media заключила соглашение с компанией VeriSign, управляющей доменом TV, в рамках которого Demand Media займется продвижением домена TV в качестве доменной зоны для размещения видео дальше »