Новый алгоритм для оценки достоверности статей Wikipedia

Опубликовано: 5 ноября 2013 г., вторник

Новый алгоритм оценки статей Wikipedia повысит достоверность статей для читателей и поможет редакторам сфокусироваться на материалах, которые требуют правки и доработки.

В базе свободной энциклопедии присутствует огромное количество статей более чем на 200 языках. Однако качество статей весьма разнится: наряду с информативными и полезными статьями присутствуют поверхностные и даже дезинформирующие. Посетитель сайта не всегда может быть уверен в достоверности данной статьи в Wikipedia.

Разработчики Сиангйю Цинь (Xiangju Qin) и Падрэг Каннигем (Pádraig Cunningham) из Университета Дублина представили алгоритм, позволяющий оценить статью Wikipedia на основании авторитетности редакторов и продолжительности «жизни» их правок. Проблему вандализма исследователи обошли, проигнорировав в своих расчетах правки, которые вносили анонимные редакторы. Авторитетность авторов алгоритм оценивает не только по продолжительности пребывания в сообществе, но также по количеству связей с сообществом, так как замечено, что наибольший вклад в создание качественных статей вносят именно активные участники сообщества.

Алгоритм был протестирован на 9,000 статей Wikipedia. По словам авторов: «Статьи с со значительным вкладом авторитетных авторов обычно имеют высокое качество, также эти статьи, в общем, формируют больше взаимодействий и связей между авторами».

Источник: searchengines.ru
Копировать, распространять, публиковать информацию портала News.lt без письменного согласия редакции запрещено.

Комментарии Facebook

Новый комментарий


Captcha

Хакеры добрались до "Second Life"

Виртуальный мир Second Life был недоступен около 15 минут в минувшее воскресенье, сообщает The Register. дальше »

Порнотехнологии компании BMW

Поисковик Google отправил в черный список германский сайт компании BMW. дальше »

Названы главные цели хакеров

Институт SANS опубликовал новую версию ежегодного рейтинга главных целей хакеров. дальше »

Спам-атака взвинчивает курс акций

PandaLabs сообщает о распространении большого количества спама в попытке повысить продажи акций определенной компании. дальше »

В декабре в Сан-Пауло состоится конференция ICANN

В Сан-Пауло (Бразилия) в период со 2-го по 8-е декабря этого года пройдет 27-ая конференция ICANN. дальше »

Япония рассмотрит возможность принятия закона о нейтралитете интернета

Власти Японии сформировали специальную рабочую группу, которая рассмотрит возможность принятия закона о нейтралитете интернета. дальше »

Сеть для любителей моды

Сегодня в Интернете можно найти одежду и косметику, базы данных для размещения портфолио, последние новости моды... дальше »

В интернете живет миллиард человек

В ООН подсчитали количество пользователей интернета. Как оказалось, число таких людей превысило 1 миллиард человек. дальше »

80% мирового спама создают 10 человек

Авторитетная организация Spamhaus опубликовала список из десяти персон, ответственных за каждые восемь из десяти ежедневно приходящих к Вам на ящик нежелательных писем. дальше »

60 проц. поиска недвижимости через Интернет осуществляется в рабочее время

Согласно данным портала по недвижимости, в течение августа-ноября с.г. 60 проц. подключений пользователей к порталу осуществлялось с понедельника по пятницу с 9 до 18 час. дальше »