Българската компания за семантичен софтуер Онтотекст АД ще спонсорира за втора поредна година събитието Datathon, което традиционно събира специалисти и ентусиасти в областта на управлението и анализа на данни. Тазгодишното трето издание на Datathon ще се проведе от 9 до 11 февруари в София и ще обхване редица реални казуси, свързнаи с иновативни ИТ области като компютърното зрение, Natural Language Processing (NLP) и изкуствения интелект (AI, Artificial Intelligence). Организатор е Data Science Society. През тази година събитието ще се предава и онлайн.
На Datathon 2018 Онтотекст ще се включи с казуса „Прогнозиране на взаимовръзки между дъщерни дружества, извлечени автоматично от новините чрез машинно обучение“ (Machine learning (ML) prediction of parent-subsidiary relations from news). Идеята произхожда от реални бизнес казуси на клиенти на компанията, които често разполагат с огромни масиви от текстове и търсят възможности за по-ефективно извличане на информация от тях. Това включва както базови концепции за организации, хора и местоположения, така и за взаимоотношенията помежду им.
Чрез методите за машинно обучение изкуственият интелект вече може да извлича такива взаимоотношения, появяващи се в текста на база на съществуващи анотации. Този метод обаче предполага наличието на голям брой експертни анотации, което е скъпо и трудоемко начинание. Затова се търсят начини за обучаване на изкуствения интелект да извлича информация както от текстовете, така и отворени публични масиви от данни, използвайки ги за автоматично анотиране на много по-големи количества текст, отколкото човешки експерти биха могли да обработят. Казусът на Онтотекст ще предизвика екип от специалисти в областта на данните да използва подобни machine learning методи в текст, който вече е бил автоматично анотиран.
От страна на компанията в Datathon 2018 ще се включат и менторите др. Лаура Толоси - Халачева, главен учен в сферата на данните и Андрей Тагарев, софтуерен инженер. След събитието Онтотекст ще награди избрани участници в него.