Bis 2026 über 80 % der Unternehmen werden KI-APIs oder generative KI-Anwendungen einsetzen. KI-Modelle und die Daten, mit denen sie trainiert und optimiert werden, können Anwendungen von allgemein zu wirkungsvoll machen und Kunden und Unternehmen einen greifbaren Mehrwert bieten.
Beispielsweise nutzt das generative, KI-gesteuerte Golf-Fan-Erlebnis des Masters Echtzeit- und historische Daten, um Einblicke und Kommentare für über 20.000 Videoclips zu liefern. Qualität und Quantität der Daten können über den Erfolg von KI entscheiden, und Unternehmen, die ihre Daten effektiv nutzen und verwalten, werden den größten Nutzen daraus ziehen. Aber so einfach ist es nicht. Daten explodieren, sowohl in Bezug auf das Volumen als auch auf die Vielfalt.
Entsprechend Internationale Datengesellschaft (IDC) werden bis 2025 gespeicherte Daten Wachstum um 250 % über On-Premise- und Cloud-Plattformen hinweg. Mit dem Wachstum geht die Komplexität einher. Mehrere Datenanwendungen und -formate erschweren es Unternehmen, auf alle ihre Daten zuzugreifen, sie zu verwalten und effektiv für KI zu nutzen. Führungskräfte müssen den Einsatz prohibitiver On-Premise-Ansätze und monolithischer Datenökosysteme überdenken und gleichzeitig die Kosten senken und eine ordnungsgemäße Datenverwaltung und einen Selfservice-Zugriff auf mehr Daten aus unterschiedlichen Datenquellen sicherstellen.
Skalierung von Daten und KI mit Technologie, Menschen und Prozessen
Damit Daten als Differenzierungsmerkmal für KI genutzt werden können, ist ein Gleichgewicht zwischen Technologie, Menschen und Prozessen erforderlich. Um KI-Anwendungsfälle zu skalieren, müssen Sie zunächst Ihre strategischen Ziele für Ihre Daten verstehen, die sich aufgrund der generativen KI wahrscheinlich geändert haben. Richten Sie Ihre Datenstrategie auf eine zukunftsorientierte Architektur aus, in die vorhandene Technologieinvestitionen, Governance und autonomes Management einbezogen werden. Nutzen Sie KI, um Aufgaben wie Daten-Onboarding, Datenklassifizierung, -organisation und -kennzeichnung zu automatisieren. Dies erfordert, dass Sie Ihre Datenverwaltungsprozesse weiterentwickeln und Lernpfade aktualisieren.
Aufbau einer offenen und vertrauenswürdigen Datengrundlage
Unternehmen müssen sich auf den Aufbau einer offenen und vertrauenswürdigen Datengrundlage konzentrieren, um auf vertrauenswürdige Daten für KI zugreifen zu können. Open schafft eine Grundlage für die Speicherung, Verwaltung, Integration und den Zugriff auf Daten, die auf offenen und interoperablen Funktionen basiert, die Hybrid-Cloud-Bereitstellungen, Datenspeicherung, Datenformate, Abfrage-Engines, Governance und Metadaten umfassen. Dies ermöglicht eine einfachere Integration in Ihre vorhandenen Technologieinvestitionen, beseitigt Datensilos und beschleunigt die datengesteuerte Transformation.
Durch die Schaffung einer vertrauenswürdigen Datengrundlage wird eine qualitativ hochwertige, zuverlässige, sichere und kontrollierte Daten- und Metadatenverwaltung ermöglicht, sodass diese für Analyse- und KI-Anwendungen bereitgestellt werden können und gleichzeitig die Anforderungen an Datenschutz und gesetzliche Vorschriften erfüllt werden. Die folgenden vier Komponenten helfen beim Aufbau einer offenen und vertrauenswürdigen Datengrundlage.
1. Modernisierung Ihrer Dateninfrastruktur zur Hybrid Cloud für Anwendungen, Analysen und KI der neuen Generation
Die Einführung von Multicloud- und Hybridstrategien wird obligatorisch und erfordert Datenbanken, die flexible Bereitstellungen in der gesamten Hybrid Cloud unterstützen. Gartner prognostiziert, dass 95 % neuer digitaler Initiativen werden auf Cloud-nativen Plattformen entwickelt, die für KI-Technologien, die enorme Datenspeicherung und Skalierbarkeit erfordern, unverzichtbar sind.
2. Datengesteuerte Anwendungen, Analysen und KI mit den richtigen Datenbanken und einer Open-Data-Lakehouse-Strategie unterstützen
Zum Speichern und Analysieren von Daten müssen Sie die die richtige Datenbank für die richtige ArbeitslastDatentypen und Preisleistung. So stellen Sie sicher, dass Sie über eine Datengrundlage verfügen, die mit Ihren Datenanforderungen wächst, wo auch immer sich Ihre Daten befinden. Ihre Datenstrategie sollte Datenbanken umfassen, die mit offenen und integrierten Komponenten entwickelt wurden, um eine nahtlose Vereinheitlichung und den Zugriff auf Daten für erweiterte Analyse- und KI-Anwendungen innerhalb einer Datenplattform zu ermöglichen. So kann Ihr Unternehmen wertvolle Erkenntnisse gewinnen und fundierte Entscheidungen treffen.
Organisationen benötigen beispielsweise leistungsstark, sicher, belastbar Transaktionale Datenbanken um ihre wichtigsten Betriebsdaten zu verwalten. Dank der Hybrid Cloud-Verfügbarkeit können Unternehmen ihre Datenbanken nutzen, um Legacy-Apps zu modernisieren, neue Cloud-native Apps zu erstellen und KI-Assistenten und Unternehmensanwendungen zu betreiben.
Da sich Datentypen und Anwendungen weiterentwickeln, benötigen Sie möglicherweise spezielle NoSQL-Datenbanken zur Handhabung unterschiedliche Datenstrukturen und spezifische Anwendungsanforderungen. Hierzu gehören Zeitreihen, Dokumentation, Messaging, Schlüssel-Wert-, Volltextsuche und In-Memory-Datenbanken, die verschiedene Anforderungen erfüllen, wie etwa IoT, Content Management und georäumliche Anwendungen.
Antreiben KI- und Analyse-Workloads Wenn Sie Ihre Transaktions- und Spezialdatenbanken verwalten, müssen Sie sicherstellen, dass sie sich nahtlos in eine Open Data Lakehouse-Architektur integrieren lassen, ohne Duplizierung oder zusätzliche ETL-Prozesse (Extrahieren, Transformieren, Laden). Mit einem Open Data Lakehouse können Sie auf eine einzige Kopie der Daten zugreifen, egal wo sich Ihre Daten befinden.
Ein offenes Data Lakehouse verarbeitet mehrere offene Formate (wie Apache Iceberg über Cloud Object Storage) und kombiniert Daten aus verschiedenen Quellen und vorhandenen Repositories in der Hybrid Cloud. Das preisgünstigste Data Lakehouse ermöglicht außerdem die Trennung von Speicher und Rechenleistung mit mehreren Open-Source-Abfrage-Engines und die Integration mit anderen Analyse-Engines, um Workloads für ein besseres Preis-Leistungs-Verhältnis zu optimieren.
Dazu gehört die Integration mit Ihren Data Warehouse-Engines, die jetzt Echtzeit-Datenverarbeitung und Entscheidungsfindung mit kostengünstigem Objektspeicher, Open Source-Technologien und einer gemeinsamen Metadatenebene in Einklang bringen müssen, um Daten nahtlos mit Ihrem Data Lakehouse zu teilen. Mit einer offenen Data-Lakehouse-Architektur können Sie jetzt Ihre Data Warehouse-Workloads hinsichtlich des Preis-Leistungs-Verhältnisses optimieren und traditionelle Data Lakes mit besserer Leistung und Governance für KI modernisieren.
Unternehmen haben möglicherweise auch Petabytes, wenn nicht sogar Exabytes an wertvollen proprietären Daten in ihrem Mainframe gespeichert, die für neue Erkenntnisse und ML/AI-Modelle freigegeben werden müssen. Mit einem Open Data Lakehouse, das die Datensynchronisierung zwischen dem Mainframe und offenen Formaten wie Iceberg unterstützt, können Unternehmen Betrug besser erkennen, das Verhalten der Kunden verstehen und prädiktive KI-Modelle erstellen, um erweiterte Geschäftsergebnisse zu verstehen, vorherzusehen und zu beeinflussen.
Vor dem Bau vertrauenswürdige generative KI Für Ihr Unternehmen benötigen Sie die richtige Datenarchitektur, um diese unterschiedlichen Daten vorzubereiten und in Qualitätsdaten umzuwandeln. Für generative KI könnte die richtige Datengrundlage verschiedene Wissensspeicher umfassen, darunter NoSQL-Datenbanken für Konversationen, Transaktionsdatenbanken für Kontextdaten, eine Data-Lakehouse-Architektur zum Zugriff auf und zur Vorbereitung Ihrer Daten für KI und Analysen sowie Vektor-Embedding-Funktionen zum Speichern und Abrufen von Embeddings für Retrieval Augmented Generation (RAG). Eine gemeinsame Metadatenebene, Governance zum Katalogisieren Ihrer Daten und Datenherkunft ermöglichen vertrauenswürdige KI-Ausgaben.
3. Eine Vertrauensbasis schaffen: Datenqualität und Governance für Enterprise-KI
Da Unternehmen bei wichtigen Entscheidungen zunehmend auf künstliche Intelligenz (KI) setzen, kann die Bedeutung von Datenqualität und -verwaltung nicht genug betont werden. Laut Gartner 30 % der generativen KI-Projekte werden voraussichtlich bis 2025 aufgrund schlechter Datenqualität, unzureichender Risikokontrollen, steigender Kosten oder unklarem Geschäftswert aufgegeben. Die Folgen der Verwendung minderwertiger Daten sind weitreichend und umfassen Verlust des Kundenvertrauens, Nichteinhaltung von Vorschriften sowie finanzielle Schäden und Reputationsschäden.
Um diese Risiken zu minimieren, ist ein effektives Datenqualitätsmanagement von entscheidender Bedeutung. Eine gut durchdachte Datenarchitekturstrategie ist für das Erreichen dieses Ziels unverzichtbar. Ein Datengewebe bietet Datenverantwortlichen einen robusten Rahmen, um Daten zu profilieren, Datenqualitätsregeln zu entwerfen und anzuwenden, Verstöße gegen die Datenqualität zu erkennen, Daten zu bereinigen und Daten zu erweitern. Dieser Ansatz stellt sicher, dass Datenqualitätsinitiativen Genauigkeit, Zugänglichkeit, Aktualität und Relevanz bieten.
Darüber hinaus ermöglicht ein Data Fabric eine kontinuierliche Überwachung der Datenqualität durch Datenbeobachtungsfunktionen, sodass Unternehmen Datenprobleme erkennen können, bevor sie zu größeren Problemen eskalieren. Diese Transparenz der Datenflüsse ermöglicht es Daten- und KI-Verantwortlichen auch, potenzielle Probleme zu erkennen und sicherzustellen, dass die richtigen Daten für die Entscheidungsfindung verwendet werden.
Indem sie der Datenqualität und -verwaltung Priorität einräumen, können Unternehmen Vertrauen in ihre KI-Systeme aufbauen, Risiken minimieren und den Wert ihrer Daten maximieren. Es ist wichtig zu erkennen, dass Datenqualität nicht nur ein technisches Problem ist, sondern ein kritisches Geschäftsgebot, das Aufmerksamkeit und Investitionen erfordert. Durch die Umsetzung der richtigen Datenarchitekturstrategie können Unternehmen das volle Potenzial ihrer KI-Initiativen ausschöpfen und ihren Geschäftserfolg steigern.
4. Daten für KI verwalten und bereitstellen
Daten sind für die KI von grundlegender Bedeutung, vom Erstellen von KI-Modellen mit den richtigen Datensätzen über das Optimieren von KI-Modellen mit branchenspezifischen Unternehmensdaten bis hin zur Verwendung vektorisierter Einbettungen zum Erstellen von RAG-KI-Anwendungen (einschließlich Chatbots, personalisierter Empfehlungssysteme und Anwendungen zur Bildähnlichkeitssuche).
Vertrauenswürdige, kontrollierte Daten sind unerlässlich, um die Genauigkeit, Relevanz und Präzision von KI sicherzustellen. Um den vollen Wert von Daten für KI auszuschöpfen, müssen Unternehmen in der Lage sein, ihre komplexen IT-Landschaften zu navigieren, um Datensilos aufzubrechen, ihre Daten zu vereinheitlichen und vertrauenswürdige, kontrollierte Daten für ihre KI-Modelle und -Anwendungen vorzubereiten und bereitzustellen.
Mit einer Open-Data-Lakehouse-Architektur auf Basis offener Formate für die Verbindung mit und den Zugriff auf wichtige Daten aus Ihrem vorhandenen Datenbestand (einschließlich Data Warehouses, Data Lakes und Mainframe-Umgebungen) können Sie eine einzige Kopie Ihrer Unternehmensdaten zum Erstellen und Optimieren von KI-Modellen und -Anwendungen verwenden.
Mit einer semantischen Ebene können Sie Datenanreicherungen generieren, die es Kunden ermöglichen, zuvor kryptische, effektiv strukturierte Daten in Ihrem gesamten Datenbestand durch semantische Suche in natürlicher Sprache zu finden und zu verstehen, um die Datenermittlung zu beschleunigen und schneller Datenerkenntnisse freizusetzen, ohne dass SQL erforderlich ist.
Mithilfe einer direkt in Ihr Lakehouse eingebetteten Vektordatenbank können Sie Ihre Daten nahtlos als vektorisierte Einbettungen für RAG-Anwendungsfälle speichern und abfragen und so die Relevanz und Präzision Ihrer KI-Ausgaben verbessern.
Wert schaffen und aufbauen mit Datenprodukten, KI-Assistenten, KI-Anwendungen und Business Intelligence
Mit einer offenen und vertrauenswürdigen Datengrundlage können Sie das volle Potenzial Ihrer Daten ausschöpfen und daraus Mehrwert schaffen. Dies lässt sich erreichen, indem Sie Datenprodukte, KI-Assistenten, KI-Anwendungen und Business-Intelligence-Lösungen entwickeln, die auf einer KI- und Datenplattform basieren, die Ihre vertrauenswürdigen Daten nutzt.
Datenprodukte sind beispielsweise wiederverwendbare, verpackte Datenbestände, die zur Steigerung des Geschäftswerts verwendet werden können, wie z. B. Vorhersagemodelle, Datenvisualisierungen oder Daten-APIs. KI-Assistenten, Anwendungen und KI-gestützte Business Intelligence können Benutzern helfen, bessere Entscheidungen zu treffen, indem sie Erkenntnisse, Empfehlungen und Vorhersagen liefern. Mit den richtigen Daten können Sie eine datengesteuerte Organisation aufbauen, die Geschäftswert und Innovation fördert.
Um mit dem Aufbau Ihrer Datengrundlage für KI zu beginnen, erkunden Sie unsere Datenverwaltungslösungen mit IBM®-Datenbanken, watsonx.data™ und Data Fabric und skalieren Sie KI mit vertrauenswürdigen Daten.
Entdecken Sie unsere Lösungen und erfahren Sie, wie Sie Ihren idealen Datenbestand entwerfen und aufbauen