Българската софтуерна компания „Онтотекст“ подобрява ефективността и скалируемостта в своята семантична база данни GraphDB

Разработеният изцяло в България продукт е сред най-известните графови бази в целия свят и се използва от клиенти като Парламентът на Великобритания, Financial Times, BBC и Springer Nature

автор: Петър Симеонов

2018-10-11 08:30:00

Произведено в България

Прегледи: 2497

Българската софтуерна компания „Онтотекст“ подобрява ефективността и скалируемостта в своята семантична база данни GraphDB

Българската компания за семантичен софтуер „Онтотекст“ АД, част от „Сирма Груп Холдинг“ АД, представи новата версия 8.7 на своята графова база данни GraphDB. С нея се увеличава скалируемостта и ефективноста при работата със семантично обогатени данни и се добавя възможност за търсене на съвпадение на концепции. GraphDB извежда работата с информационни масиви до следващо ниво, улеснявайки създаването на смислови връзки между данните и извличането на много повече стойност от тях.

GraphDB е изцяло разработен в България продукт и вече се е наложил като една от най-популярните семантични бази данни в световен мащаб, а сред клиентите й са институции като Парламентът на Великобритания, Националният архив на Великобритания и Британският музей, медийни групи като The Financial Times, BBC, Press Association и Euromoney, научни издателства като Springer Nature, компании и организации от различни области, включително Elsevier, Kadaster NL, S&P Platts, IET и Getty Trust.

В новата версия 8.7 на GraphDB екипът на българския разработчик е добавил поддръжка за намиране на съвпадение на концепции в графовете за знания. Това се осъществява с помощта на нова приставка, връщаща резултати с подобия в термини, документи и обекти, базирана на методи за статистическа семантика като Random Projection. Благодарение на новата функционалност, потребителите могат да получат повече резултати въз основа на съвпадение на семантично близки концепции, които не могат да бъдат получени по друг начин. Например, когато възникне нов въпрос към помощен център на компания, потребителите ще могат да запитват и намират подобни въпроси в базата данни и как те са получили отговор в миналото. Плъгинът за сходство може да се използва за намиране на една и съща новина от различни източници, а търсенето на семантично сходство обогатява източниците в събирането и обработката на новини.

Друго важно нововъведение е, че GraphDB 8.7 има много по-бърз протокол за вътрешно федериране в хранилища, което ускорява значително оценката на заявките в сравнение с не-оптимизирано SPARQL федериране. Действителното ускоряване зависи от модела на обединяване – оценките показват 2х до 8х по-добра ефективност в различни заявки при сценарий за анализи на новини, използващи семантични метаданни и големи графи от знания, получени от демонстрационната услуга на Ontotext FactForge.net.

Друго подобрение на производителността подпомага динамичното управление на големите графи от знания. GraphDB 8.7 прави по-бързи проверки, благодарение на оптимизацията, която минимизира натоварването на транзакциите. Резултатът е два пъти по-бърза актуализация на сценариите, подобни на критерият на Linked Data Benchmark Council (LDBC) за семантично публикуване, където малките транзакции извършват чести актуализации в графа на знание с 1 милиард записа.

Не на последно място в GraphDB 8.7 има подобрения, които правят операциите на критичните бази данни по-лесни и по-надеждни. GraphDB вече може да създаде резервно копие на активно хранилище, като променя състоянието си от четене / запис само до четене. Това позволява ефективни резервни копия.