Google разместит старые газеты и журналы в Интернете

Опубликовано: 13 сентября 2008 г., суббота

 

Google сообщает о новой инициативе – на сей раз компания намерена разместить в Интернете тысячи оцифрованных снимков старых газет и журналов. В компании отмечают, что все печатные издания, которые планируется отсканировать и разместить в сети, были выпущены еще до эпохи расцвета Интернета.

В компании говорят о подписании партнерских соглашений с примерно сотней западных издательств на сканирование и публикацию их архива. По условиям соглашения, Google будет сканировать старые издания полностью, без каких-либо сокращений и вырезок.

«Это огромный объем контента. Мы приводим его в качественно новый формат», – говорит вице-президент Google М. Меер.

О новой инициативе компании было объявлено на бизнес-конференции TechCrunch50, ориентированной на начинающий бизнес. Здесь собираются представители стартапов с одной стороны и инвесторы с другой.

По словам Меер, работа по оцифровке газет уже началась и на конференции были показаны снимки из газеты Rome News Tribune, где публиковалась статья о высадке американских астронавтов на Луну. «Можно отследить, как тот или иной момент или событие освещались различными изданиями, кроме того, при изучении таких материалов прекрасно ощущается дух того времени», – говорит она.

Для работы с архивами Google создала несколько модифицированный поисковый алгоритм, который оптимизирован для поиска по заголовкам, авторам и изданиям. Кроме того, алгоритм при нахождении требуемого материала работает таким образом, что в боковом окне отражаются схожие статьи из других газет.

Меер рассказала, что для «газетного проекта» используется алгоритм, схожий с тем, что был применен при работе проекта Google Books.

Ранее Google заключила соглашения с наиболее крупными американскими изданиями – New York Times и Washington Post. Однако теперь список издателей был расширен и в него также вошли европейские газеты.

«Такой подход даст нам возможность находить более разнообразные материалы из крупных и небольших газет», – пишет в блоге менеджер Google П. Сони. «Эта инициатива только что стартовала, мы постоянно подключаем все новых и новых издателей. Наша конечная цель заключается в создании цифрового архива с несколькими миллиардами страниц».

Для того, чтобы как-то заинтересовать газетчиков поделиться своими архивами, Google будет размещать в проекте рекламу, часть прибыли с которой будет получать то или иное издание.

На сегодня самая старая газета, присутствующая в архиве, относится к газете Quebec Chronicle-Telegraph и датирована 1764 годом. Российская тематика в западных СМИ обсуждается также довольно активно. Например, одна из наиболее старых записей, касающаяся России, датирована 1903 годом и относится к реформам министра Керенского. Статья была написана 1 ноября 1903 года в Петрограде корреспондентом NY Times.

Источник: cybersecurity.ru
Копировать, распространять, публиковать информацию портала News.lt без письменного согласия редакции запрещено.

Комментарии Facebook

Новый комментарий


Captcha

статьи по схожей тематике

Carousel сохранит ваши фото и видео на всю жизнь

Компания Dropbox представила приложение Carousel, предназначенное для сбора в одном месте фотографии и видеозаписи на протяжении всей жизни. дальше »

Уязвимость Heartbleed угрожает ещё и оборудованию

Прореха в защите повсеместно используемого в сети Интернет протокола зашифрованной передачи данных SSL, обнаруженная в конце марта 2014 года, создала проблемы не только на веб–ресурсах, но и в сетевых аппаратных средствах. дальше »

Как Apple и Google борются за игры для своих магазинов приложений

Приложений для Android много, разработчики также не обделяют вниманием мобильную операционную систему Google, а по количеству загрузок Google Play уже и вовсе опередил App Store. дальше »

Безопасность сайта практически не зависит от языка программирования

Компания WhiteHat Security опубликовала статистический отчет о количестве уязвимостей в веб–приложениях “2014 Website Security Statistics Report”. дальше »

Открытое пространство в домене .COM

К настоящему времени в домене .COM зарегистрировано более 113 млн доменных имен. дальше »

В Бразилии прошла Глобальная многосторонняя конференция по управлению Интернетом

23–24 апреля в Сан–Паулу (Бразилия) состоялась Глобальная многосторонняя конференция о будущем управления Интернетом. дальше »

Хакеры взломали ТВ-сервис Samsung

Хакеры выложили в открытый доступ сведения об учётных записях 158 тыс. пользователей популярного интернет-сервиса Boxee.tv компании Samsung - одного из конкурентов Apple TV. дальше »

Представлена новая версия мессенджера Hangouts для Android

Компания Google выпустила новую версию приложения Hangouts для Android. Обновление станет доступно всем пользователям в течение нескольких дней. дальше »

Начал работу действительно защищенный сервис электронной почты

Немецкий разработчик Феликс Мюллер–Ирион объявил о запуске сервиса электронной почты Lavaboom, который позиционируется как максимально защищенный от любых посягательств – включая интерес со стороны АНБ США. дальше »

Эксперты обнаружили способ обхода мер безопасности в Steam

Для похищения учетной записи мошенники используют фишинговые страницы. дальше »