Neo4j kündigt Connector für Apache Spark an

Integration ermöglicht Spark-Anwendern einfachen und schnellen Zugang zu neuen Funktionalitäten rund um Graph Analytics und Graph Data Science

München, 12. November 2020 – Neo4j, führender Anbieter von Graphtechnologie, kündigt die Verfügbarkeit des Neo4j Connector for Apache Spark an. Das Integrationstool ermöglicht die einfache Übertragung von Daten zwischen der Neo4j Graphdatenbank und Apache Spark.

Apache Spark gilt als Standard-Framework zur Datenverarbeitung in Unternehmen und wird insbesondere für komplexe Daten bei Machine-Learning-Modellen und prädiktiven Datenanalysen genutzt. Der Neo4j Connector for Apache Spark bietet eine bidirektionale Schnittstelle für die Datensätze aus Neo4j sowie anderen relationalen und NoSQL-Repositories. Daten lassen sich je nach Bedarf und Anwendungsfall in einem Graphen oder einer Tabelle bearbeiten und abfragen. Der Connector steht ab sofort allen Neo4j Kunden kostenlos zur Verfügung.

Neo4j Connector for Apache Spark wurde auf Wunsch der Spark und Neo4j Communities entwickelt, um Graphen auf Machine-Learning-Pipelines anzuwenden, Datensilos zu konsolidieren und einen höheren Nutzen aus vorhandenen Datensätzen zu ziehen.

  • Neo4j-Anwender können mit dem Apache Spark Connector ihre Graphen mit jedem beliebigen System oder anderer Datenquelle verknüpfen. Darüber hinaus lassen sich tabellarische Daten in Graphen umwandeln und setzen so Informationen in einen erweiterten Datenkontext. Durch die bidirektionale Integration bereinigt und transformiert Spark Daten, die von Neo4j-Graphanwendungen genutzt werden, und speist sie in jeglichen Spark Workflow ein.
  • Spark-Anwender können mit dem Connector das Potential der Graphtechnologie für sich nutzen. So helfen die mit Kontext angereicherten Daten aus Graphen, die Genauigkeit von Prognosen zu verbessern und tiefgehende Analysen durchzuführen. Die einfache Migration von Daten aus Neo4j trägt dazu bei, komplexe Prozesse wie Machine-Learning zu optimieren, ohne bestehende Pipelines überarbeiten zu müssen.

“Die überwiegende Mehrheit unserer Unternehmenskunden arbeitet mit Apache Spark”, erklärt Amy E. Hodler, Director of Graph Analytics und AI Programs bei Neo4j. “Mit dem Neo4j Connector for Apache Spark können Anwender, Data Scientists und Entwickler nun ihre Datenpipelines konsolidieren und ihre Graphen um das Spark-Ökosystem erweitern. Das Zusammenführen von Graphdaten auf der einen und Spark-Daten auf der anderen Seite birgt neues Potential, um Fragen zu beantworten, Erkenntnisse zu gewinnen und innovative Anwendungen zu entwickeln.”

Laut Gartner* hat sich Spark “zu einer praxisorientierten Plattform entwickelt, die den Anforderungen von Unternehmen zur Anwendungsentwicklung gerecht wird. Das Framework ist einfach in der Anwendung und bildet die Basis für die Umsetzung neuer Lösungen. Sowohl die Architektur von Spark als auch die Fähigkeit, operative sowie analytische Workloads zu erfassen, zu verarbeiten und zu analysieren, erlaubt es Unternehmen, die Zeit zwischen der Datenerfassung und neuem Erkenntnisgewinn zu verkürzen.”

*Gartner, “Introduction to and Evaluation of Apache Spark for Modern Data Architectures”, Sanjeev Mohan & Sumit Pal, 14. Januar 2020.