Новини

GraphDB 8.7 е по-мощен и открива съвпадение на концепции

Дата

9 окт 2018

Tema

Sirma Group

Ontotext пусна GraphDB 8.7 - най-новата версия на своята семантична граф база данни. В нея се добавя поддръжка за концептуално съвпадение в графовете за знания, което се осъществява с помощта на нова приставка, връщаща подобни термини, документи и обекти, базирани на методи за статистическа семантика като Random Projection.

Similarity-GRAPHDB-8.7

Това продуктово обновление включва и подобрения в производителността, позволяващи ефективно обединяване на заявки в хранилища, които се намират в една единствена база данни, и по-бързи обновления в големи графове от знания. Активните хранилища вече могат да се използват като източник за архивиране, без прекъсване на операциите за четене, дори в среди без клъстери.

Например, в едно хранилище може да има един индекс, покриващ новини, друг - обхващащ всички видове обекти, като хора, организации, местоположения, и трети - покриващ теми. Тези индекси могат да бъдат използвани за вграждане на търсения на подобия като част от заявките на SPARQL, за да се даде възможност за гъвкави комбинации от заявки, базирани на графични модели, с аргументи, сходство на семантичен текст, пълнотекстово търсене, географско- пространствени ограничения и др. За разлика от пълнотекстовото търсене, те могат да търсят сходство във всички комбинации от термини и документи: да получават термини, подобни на зададен такъв, да намират подобни обекти или документи, да търсят документ по термин или да получават термини, които са най-характерни за даден документ.

Ontotext непрекъснато подобрява GraphDB, като разширява нейните функции, за да обслужва различни варианти на използване. Благодарение на новата приставка потребителите могат да получат повече резултати въз основа на съвпадение на семантично близки концепции - резултати, които не могат да бъдат получени чрез структурирани и пълнотекстови заявки за търсене, които изискват точно съвпадение на думи или идентификатори. Например, когато възникне нов въпрос, потребителите ще могат да запитват и намират подобни въпроси в базата данни и как те са получили отговор в миналото. Плъгинът за сходство може да се използва за намиране на една и съща новина от различни източници, а търсенето на семантично сходство обогатява източниците в събирането и обработката на новини.

Новата версия на GraphDB има много по-бърз протокол за вътрешно федериране в хранилища в една и съща инстанция база данни. Той предлага няколко пъти по-бърза оценка на заявките в сравнение със сценария, при който данните в хранилищата се комбинират чрез не-оптимизирано SPARQL федериране. Действителното ускоряване зависи от модела на обединяване - оценките показват 2х до 8х по-добра ефективност в различни заявки в сценарий за анализи на новини, използващи семантични метаданни и големи графи от знания, получени от демонстрационната услуга на Ontotext FactForge.

Друго подобрение на производителността подпомага динамичното управление на големите графи от знания. GraphDB 8.7 прави по-бързи проверки, благодарение на оптимизацията, което минимизира режийните разходи. Резултатът е два пъти по-бърза актуализация на сценариите, подобни на критерият на Linked Data Benchmark Council (LDBC) за семантично публикуване, където малките транзакции извършват чести актуализации в графа на знание с 1 милиард записа.

Най-накрая, но не на последно място, GraphDB 8.7 има подобрения, които правят операциите на критичните бази данни по-лесни и по-надеждни. GraphDB вече може да създаде резервно копие на активно хранилище, като променя състоянието си от четене / запис само до четене. Това позволява ефективни резервни копия без да се чете времето на престой.

В това обновление на продукта въведохме най-новите версии на Elasticsearch v.6.3.x, Solr v.7.4.x и Lucene v.7.4.x и преструктурирахме използването на REST клиент вместо Transport клиенти.

Може да научите повече и изпробвате богатите възможности на GraphDB 8.7.