Артур Скальский

© РИА-Новости

Интернет и ИТМир

2834

19.07.2013, 13:04

РИА Новости открывает доступ к открытым данным

Семантическая платформа РИА Новости представлена на Международном саммите по семантике и оценена экспертами как одна из ведущих в мире, сообщает Digit.ru.

Специалист по семантике Боннского университета профессор Сорен Ауэр (Soeren Auer) отметил, что даже открытые данные в формате "2 звезды" или "3 звезды" (в форматах xls и csv соответственно) уже замечательное достижение сейчас. Тем приятнее ему видеть такое большое количество проектов с открытыми данными в России, включая государственные проекты, касающиеся тендеров. А данные открытые по формату "5 звезд" до сих пор редкость и в Европе. Ауэр сообщил, что открытые базы в формате "5 звезд" в Европе принадлежат обычно госструктурам. По его словам СМИ в Европе только начали перевод имеющейся информации в открытые данные по формату "5 звезд", например холдинг BBC.

Профессор Кей Сан Чой (Key-Sun Choi) из корейского университета науки и технологий KAIST согласился, что даже открытие Россией 1000 наборов открытых данных – большой успех. Для сравнения он упомянул, что в Корее за предыдущий год переведено в открытые данные только около 500 наборов. При этом в формате "5 звезд" доступно менее чем сотня наборов форматов открытых данных и опять-таки все эти наборы раскрыты государственными органами. В отличие от России, СМИ Южной Кореи также не имеют пока открытых данных, представленных в формате "5 звезд", по словам профессора Чоя. Пока они применяются для госуслуг, хотя есть и бытовые примеры: например в Сеуле можно узнать расписание всех автобусов, сообщается на правительственном сайте, посвященном открытым данным.

Оба ученых отметили, что сейчас относительно налажен процесс передачи открытия данных "сверху вниз", от государства обществу, но пока есть сложности с механизмами открытия и обмена данных гражданами и организациями. Такой обмен, по мнению профессора Чоя, очень помог бы развитию многих сфер бизнеса. Например, в туристической сфере, важной для России, он полагает возможным сбор данных о качестве еды в ресторанах и сервиса в гостиницах методом краудфандинга. А профессор Ауэр упомянул, что использование собственной семантической платформы для обработки данных и дальнейшее открытие данных такого крупного СМИ как РИА Новости – это хороший пример открытия информации "снизу".

Директор офиса W3C в России и зам. директора института информационных технологий ВШЭ Виктор Клинцов считает, что внедрение новых цифровых технологий и переход на открытые данные уже вопрос выживания, а не прибыли. По его мнению, без современных семантических технологий (например, семантических платформ, необходимых для структурирования цифровых данных) через 2-3 года компании перестанут выживать. В США большая тройка New York Times, Associated press и Reuters занимаются вопросами семантики в отношении цифровых данных". Также он предположил, что наличие наборов открытых данных у российского и американских СМИ открывает возможность проведения совместных проектов по синхронизации этих данных.

В целом, по мнению Клинцова, Российское государство достаточно быстро организовало открытие данных и в дальнейшем это может помочь экономическому росту страны. Он сослался на опыт ЕС, где считается, что вложения государства в открытие данных окупится за счет роста малого бизнеса на проектах с открытыми данными. Профессор Ауэр считает важным, что текущий саммит по семантике проходит в России, так как раньше Россия держалась несколько особняком в вопросах изучения семантической технологии, а теперь исследователи смогут обменяться опытом.

Во время саммита были приведены данные теста BSBM, по которым система управления базами данных OntoQuad показала самую высокую производительность. Именно ее РИА Новости совместно с компанией Eventos адаптировали для отечественной семантической платформы. Независимое тестирование проводилось в институте информатики Лейпцигского университетом. По его результатам OntoQuad существенно превзошла по производительности конкурирующие решения Virtuoso, Jenna TDB, BigData.

"В будущем семантическая платформа РИА Новости позволит, например, создавать для каждого читателя его личную ленту новостей, которая будет учитывать его интересы и месторасположение", — описал одно из конкретных применений базы с открытыми данными Роман Никулин, начальник отдела семантического производства объединенной редакции новостей РИА Новости. Он отметил, что семантическая платформа РИА Новости уже используется как в редакции, так и способна выдавать данные внешним клиентам. Например, редактору эта платформа автоматически предлагает теги для статьи, а также ранее вышедшие материалы по теме текущей заметки. Партнерам семантическая платформа на базе открытых данных РИА Новости помогает быстро находить все упоминания нужной информации.

База открытых данных РИА Новости содержит все выходящие материалы агентства (до 5000 материалов в день). Данные представлены в формате "5 звезд", т.е. структурированы, машиночитаемы, связаны с другими открытыми базами данных.

Международный саммит по семантике ежегодно организует компания STI International. В нем участвуют ученые по семантике и сотрудники исследовательских отделов коммерческих компаний всего мира. В этом году саммит впервые проходит в России, в Суздале. Ожидается, что за три дня в нем примут участие около 50 специалистов и ученых.

Электронный адрес публикации открытых данных РИА Новости: opendata.ria.ru.

Артур Скальский

© РИА-Новости

Интернет и ИТМир

2834

19.07.2013, 13:04

URL: https://www.babr24.info/?ADE=116758

Bytes: 5521 / 5360

Версия для печати

Скачать PDF

Поделиться в соцсетях:

Также читайте эксклюзивную информацию в соцсетях:
- Телеграм
- ВКонтакте

Связаться с редакцией Бабра:
[email protected]

Автор текста: Артур Скальский.

Другие статьи в рубрике "Интернет и ИТ"

Немировский vs Головкин. Конфликт интересов, или Медийная война?

Летом 2025 года один из главных провайдеров Красноярского края «Орион Телеком» подвергся масштабной кибератаке на свои серверы. После восстановления провайдер провёл расследование и выяснил, что могло стать причиной взлома. Кому же было выгодно отключить одного из самых популярных провайдеров края?

Валерий Лужный

Интернет и ИТСкандалыПолитикаКрасноярск

7667

23.10.2025

T2 запускает платформу SafeWall для защиты абонентов от киберугроз

Мобильный оператор Т2 запускает объединенный бренд пользовательской безопасности. SafeWall —интеллектуальная и масштабируемая платформа, глубоко интегрированная в цифровые сервисы компании, которая сделает безопасность неотъемлемой частью сервиса.

Саша Савельева

Интернет и ИТРоссия

2795

19.10.2025

T2 и «Лаборатория Касперского» объединились для борьбы с кибермошенничеством

Мобильный оператор T2 и «Лаборатория Касперского» заключили меморандум о стратегическом партнерстве в области кибербезопасности.

Саша Савельева

Интернет и ИТРоссия

3089

10.10.2025

Блогнот. Есть ли жизнь после телеграма

Телеграмм-пессимисты обсуждают вопрос «есть ли жизнь после телеграмма», подразумевая, что блокировка популярной платформы (а это уже не мессенджер, а целая экосистема), лишь дело времени.

Илья Гращенков

Интернет и ИТОбществоПолитикаРоссия

28967

03.08.2025

Блогнот. Цифровизация vs архаизация

Похоже, два мейнстримовых гостренда начали торпедировать друг друга.

Илья Гращенков

Интернет и ИТОбществоПолитикаРоссия

28947

02.08.2025

T2 предупреждает о новой схеме мошенничества через SMS и Telegram

Оператор T2 выявил многоуровневую мошенническую схему, использующую связку SMS и Telegram. Пользователям приходят сообщения с текстом «Это твои фото?» и ссылкой, ведущей к вредоносным файлам в мессенджере, крадущим личные данные пользователя.

Саша Савельева

Интернет и ИТРоссия

6854

31.07.2025

Блогнот. Про Мах. Деньги. История. И кому всё это надо?

Для начала вопросик: Принимая во внимание закон, о котором В. Володин писал: «бросается в глаза обилие англицизмов, иностранных заимствований и наименований на других языках [...] все, кто [...] открывает бизнес, должны уважать русский язык и нашу культуру.

Иннокентий Кресик

Интернет и ИТРасследованияЭкономика и бизнесРоссия

30902

22.07.2025

Т2 внедрит голосового ассистента бесплатно всем абонентам для защиты от спама и телефонного мошенничества

Оператор запускает массовое внедрение услуги «Голосовой ассистент». Она станет доступна бесплатно всем абонентам. Сервис будет защищать клиентов от спама и фрода. Первые города, где компания уже запустила услугу, – Псков и Волгоград.

Саша Савельева

Интернет и ИТРоссия

9245

30.06.2025

Т2 защищает: SMS-коды от важных сервисов не будут приходить во время звонка

T2 вводит инновационную защиту против телефонных мошенников: SMS-коды теперь приходят с задержкой. Новая мера обеспечит дополнительную безопасность клиентам мобильного оператора, особенно пожилым людям и молодежи, снижая риск несанкционированного доступа к аккаунтам Госуслуг и банковским счетам.

Саша Савельева

Интернет и ИТРоссия

13249

01.05.2025

Монголия укрепляет кибербезопасность: цифровые права под международным контролем

Монголия продолжает укреплять позиции в сфере информационных технологий. Недавно на этом фоне страну посетила специальный докладчик ООН по праву на неприкосновенность частной жизни Ана Брайан Нугререс.

Эрнест Баатырев

Интернет и ИТОбществоПолитикаМонголия

48790

15.04.2025

Исходный код для Лаоса: Монголия предложила цифровое партнерство

Монголия планирует поделиться своими наработками в сфере цифровизации с Лаосом. Министр цифрового развития, инноваций и коммуникаций Баатархуу Цэнд выступил с инициативой экспортировать исходный код платформы E-Mongolia для запуска аналогичного проекта в Лаосской Народно-Демократической Республике.

Эрнест Баатырев

Интернет и ИТПолитикаЭкономика и бизнесМонголия

49424

14.04.2025

Блогнот. Суверенные соцсети: почему они обречены на провал

Импортозамещение интернета подчас приобретает в российской реальности причудливые формы. Попытки выстроить суверенную Сеть вряд ли окажутся полезными и эффективными. На мой взгляд, это тот самый случай, когда чрезмерное регулирование рискует оказаться не только бессмысленным, но и вредным.

Илья Гращенков

Интернет и ИТРоссия

12613

13.04.2025

Лица Сибири

Асеева Анна

Песчинская Ника

Кузнецов Александр

Пашков Владимир

Мельникова Наталья

Проценко Александр

Курбатова Татьяна

Вобликова Валентина

Ручкин Константин

Басманов Борис