Google разместит старые газеты и журналы в Интернете

Опубликовано: 13 сентября 2008 г., суббота

 

Google сообщает о новой инициативе – на сей раз компания намерена разместить в Интернете тысячи оцифрованных снимков старых газет и журналов. В компании отмечают, что все печатные издания, которые планируется отсканировать и разместить в сети, были выпущены еще до эпохи расцвета Интернета.

В компании говорят о подписании партнерских соглашений с примерно сотней западных издательств на сканирование и публикацию их архива. По условиям соглашения, Google будет сканировать старые издания полностью, без каких-либо сокращений и вырезок.

«Это огромный объем контента. Мы приводим его в качественно новый формат», – говорит вице-президент Google М. Меер.

О новой инициативе компании было объявлено на бизнес-конференции TechCrunch50, ориентированной на начинающий бизнес. Здесь собираются представители стартапов с одной стороны и инвесторы с другой.

По словам Меер, работа по оцифровке газет уже началась и на конференции были показаны снимки из газеты Rome News Tribune, где публиковалась статья о высадке американских астронавтов на Луну. «Можно отследить, как тот или иной момент или событие освещались различными изданиями, кроме того, при изучении таких материалов прекрасно ощущается дух того времени», – говорит она.

Для работы с архивами Google создала несколько модифицированный поисковый алгоритм, который оптимизирован для поиска по заголовкам, авторам и изданиям. Кроме того, алгоритм при нахождении требуемого материала работает таким образом, что в боковом окне отражаются схожие статьи из других газет.

Меер рассказала, что для «газетного проекта» используется алгоритм, схожий с тем, что был применен при работе проекта Google Books.

Ранее Google заключила соглашения с наиболее крупными американскими изданиями – New York Times и Washington Post. Однако теперь список издателей был расширен и в него также вошли европейские газеты.

«Такой подход даст нам возможность находить более разнообразные материалы из крупных и небольших газет», – пишет в блоге менеджер Google П. Сони. «Эта инициатива только что стартовала, мы постоянно подключаем все новых и новых издателей. Наша конечная цель заключается в создании цифрового архива с несколькими миллиардами страниц».

Для того, чтобы как-то заинтересовать газетчиков поделиться своими архивами, Google будет размещать в проекте рекламу, часть прибыли с которой будет получать то или иное издание.

На сегодня самая старая газета, присутствующая в архиве, относится к газете Quebec Chronicle-Telegraph и датирована 1764 годом. Российская тематика в западных СМИ обсуждается также довольно активно. Например, одна из наиболее старых записей, касающаяся России, датирована 1903 годом и относится к реформам министра Керенского. Статья была написана 1 ноября 1903 года в Петрограде корреспондентом NY Times.

Источник: cybersecurity.ru
Копировать, распространять, публиковать информацию портала News.lt без письменного согласия редакции запрещено.

Комментарии Facebook

Новый комментарий


Captcha

статьи по схожей тематике

В Скандинавии сервис Viaplay внедряет технологии от Elemental для доставки контента на интернет–подключаемые устройства

В странах Скандинавии новые технологии от компании Elemental позволят сервису Viaplay доставлять на интернет–подключаемые устройства почти 40 эфирных каналов и тысячи часов контента класса «premium». дальше »

Червь Darlloz поразил около 32 тысяч систем на базе Linux

Компания Symantec провела анализ степени поражения систем червём Linux.Darlloz. дальше »

В Китае запущен новый интернет-поисковик

21 марта официально вступила в действие китайская поисковая система государственного уровня — Chinaso.com. Кроме собственно функций поиска система также будет предоставлять различные услуги и возможность приобретения товаров. дальше »

Check Point обнаружила критическую уязвимость в Wikipedia.org и других wiki–ресурсах

Компания Check Point Software Technologies выявила уязвимость в веб–платформе MediaWiki — программном обеспечении с открытым исходным кодом, предназначенном для создания и обслуживания wiki–ресурсов. дальше »

Регулирование или самоорганизация – что лучше для Интернета?

Генсек ООН Пан Ги Мун приветствовал намерение Национальной администрации по телекоммуникациям и информации США передать международному сообществу полномочия по использованию ключевых национальных доменных имен в Интернете. дальше »

«ТВ-флешка» от Roku

Популярный в США и Великобритании видеосервис Roku выпустил новую версию своей «ТВ-флешки»: небольшого устройства, похоже на USB-модем, с помощью которого можно подключиться к телевизору через HDMI-порт. дальше »

Google готовит запуск «детского YouTube»

Компания Google намерена запустить в обозримом будущем специальную «детскую» версию видеохостинга YouTube, которая будет ориентирована на пользователей в возрасте до 10 лет. дальше »

Самые дорогие домены начала 2014 года

Самым дорогим доменом января 2014 года стал wan.com (в переводе с китайского значит «игра»), стоимость которого составила $800 тыс. дальше »

OpenAppID - язык предназначенный для обнаружения приложений при помощи Snort

Компания Cisco объявила о выпуске OpenAppID – нового языка, предназначенного для обнаружения и определения приложений работающих в сети. дальше »

Сайты НАТО подверглись хакерской атаке

Сайты НАТО подверглись в ночь на воскресенье массированной DDoS атаке, ответственность за которую взяли на себя украинские пираты. Об этом 16 марта сообщает Франс–Пресс со ссылкой на коммюнике Североатлантического альянса. дальше »