Новый алгоритм для оценки достоверности статей Wikipedia

Опубликовано: 5 ноября 2013 г., вторник

Новый алгоритм оценки статей Wikipedia повысит достоверность статей для читателей и поможет редакторам сфокусироваться на материалах, которые требуют правки и доработки.

В базе свободной энциклопедии присутствует огромное количество статей более чем на 200 языках. Однако качество статей весьма разнится: наряду с информативными и полезными статьями присутствуют поверхностные и даже дезинформирующие. Посетитель сайта не всегда может быть уверен в достоверности данной статьи в Wikipedia.

Разработчики Сиангйю Цинь (Xiangju Qin) и Падрэг Каннигем (Pádraig Cunningham) из Университета Дублина представили алгоритм, позволяющий оценить статью Wikipedia на основании авторитетности редакторов и продолжительности «жизни» их правок. Проблему вандализма исследователи обошли, проигнорировав в своих расчетах правки, которые вносили анонимные редакторы. Авторитетность авторов алгоритм оценивает не только по продолжительности пребывания в сообществе, но также по количеству связей с сообществом, так как замечено, что наибольший вклад в создание качественных статей вносят именно активные участники сообщества.

Алгоритм был протестирован на 9,000 статей Wikipedia. По словам авторов: «Статьи с со значительным вкладом авторитетных авторов обычно имеют высокое качество, также эти статьи, в общем, формируют больше взаимодействий и связей между авторами».

Источник: searchengines.ru
Копировать, распространять, публиковать информацию портала News.lt без письменного согласия редакции запрещено.

Комментарии Facebook

Новый комментарий


Captcha

В 2007 году всплеска вирусных атак на ICQ и MSN не будет

Российские IT-компании не ожидают в 2007 году всплеска вирусных атак на ICQ, блоги и сотовые телефоны. дальше »

Интернет-мошенники ищут «новых сотрудников» в университетах

Для совершения интернет-афер киберпреступники нанимают талантливых студентов и отчаявшихся найти высокооплачиваемую работу специалистов. дальше »

Отчет Еврокомиссии по вопросам информационной безопасности

По данным Еврокомиссии, сейчас спам составляет от 50 до 80% от получаемой европейцами электронной почты дальше »

ПРОМТ заработает на литовском

На днях компания ПРОМТ объявила о начале проекта с Литвой, для которой будет разработан англо-литовский машинный переводчик. дальше »

У каждого есть своя история

На волне растущей популярности веб-рекламы и видео-ресурсов в Интернете появился еще один новичок дальше »

Хакеры назвали взломанную версию Vista в честь жены Билла Гейтса

Менее чем через две недели после официального релиза корпоративной версии новой операционной системы от Microsoft Windows Vista хакерам удалось взломать сложную систему активации ОС, считавшуюся разработчиками практически "непробиваемой". дальше »

Американских педофилов заставят раскрывать адреса почты?

Два сенатора США в четверг объявили о намерении представить законопроект по защите несовершеннолетних пользователей социальных сетей от сексуальных домогательств взрослых. дальше »

Microsoft создает библиотеку в Интернете

Все представленные книги будут доступны для чтения и загрузки полностью. дальше »

СССР должен исчезнуть и с карты интернета?

Организация по присвоению имен и адресов в интернете планирует удалить домен "SU" (интернет-зона СССР). дальше »

Слепые могут посетить только три сайта

Лишь три официальных сайта в мире могут посетить люди с проблемами зрения, для которых разработаны специальные стандарты. дальше »