DE102024000441A1 - Data sharing system and method for training artificial intelligence - Google Patents
Data sharing system and method for training artificial intelligence Download PDFInfo
- Publication number
- DE102024000441A1 DE102024000441A1 DE102024000441.6A DE102024000441A DE102024000441A1 DE 102024000441 A1 DE102024000441 A1 DE 102024000441A1 DE 102024000441 A DE102024000441 A DE 102024000441A DE 102024000441 A1 DE102024000441 A1 DE 102024000441A1
- Authority
- DE
- Germany
- Prior art keywords
- data
- regulations
- release
- compliance
- release case
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Bioethics (AREA)
- Medical Informatics (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Technology Law (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Die Erfindung betrifft ein Datenfreigabesystem (1) zur Weitergabe von Daten an eine Drittpartei in Übereinkunft mit, eine jeweilige Weitergabe betreffenden Vorschriften, umfassend Mittel zur Verarbeitung der weiterzugebenden Daten mittels künstlicher Intelligenz. Das erfindungsgemäße Datenfreigabesystem ist gekennzeichnet durch
- eine Empfangsschnittstelle (2), dazu eingerichtet einen Freigabefall-Container zu empfangen, umfassend einen Datensatz, eine Datensatzbeschreibung und einen Datensatzkontext;
- eine Falldatenbank (3), umfassend historische Freigabefall-Container;
- ein Evaluierungsmodul (4), dazu eingerichtet den Freigabefall-Container und wenigstens einen historischen Freigabefall-Container mittels eines großen Sprachmodells (LLM) zu verarbeiten, wobei das große Sprachmodell (LLM) dazu trainiert ist eine Vorschrifteneinhaltungsbewertung zu erzeugen; und
- eine Ausgabeschnittstelle (5), dazu eingerichtet zumindest den Datensatz unter Berücksichtigung der Vorschrifteneinhaltungsbewertung an die Drittpartei weiterzugeben, wenn der Freigabefall-Container den Vorschriften zumindest bis zu einem festgelegten Erfüllungsschwellwert gerecht wird.
The invention relates to a data release system (1) for forwarding data to a third party in accordance with the regulations relating to the respective forwarding, comprising means for processing the data to be forwarded using artificial intelligence. The data release system according to the invention is characterized by
- a receiving interface (2) configured to receive a release case container comprising a data record, a data record description and a data record context;
- a case database (3) comprising historical release case containers;
- an evaluation module (4) configured to process the release case container and at least one historical release case container using a large language model (LLM), the large language model (LLM) being trained to generate a compliance assessment; and
- an output interface (5) configured to forward at least the data set to the third party taking into account the compliance assessment if the release case container complies with the regulations at least up to a specified compliance threshold.
Description
Die Erfindung betrifft ein Datenfreigabesystem zur Weitergabe von Daten an eine Drittpartei nach der im Oberbegriff von Anspruch 1 näher definierten Art sowie ein Verfahren zum Trainieren eines großen Sprachmodells nach der im Oberbegriff von Anspruch 8 näher definierten Art und ein Verfahren zum Trainieren eines Modells des bestärkenden Lernens nach der im Oberbegriff von Anspruch 9 näher definierten Art.The invention relates to a data release system for forwarding data to a third party according to the type defined in more detail in the preamble of
Das Geschäft eines Unternehmens kann es erfordern, Daten mit Drittparteien auszutauschen. Ein Fahrzeughersteller kann beispielsweise Betriebsdaten seiner Fahrzeuge im Feld erheben und diese in Rohform oder auch in aufbereiteter Form für eine Analyse an einen Kunden weitergeben. Beispielsweise können solche Daten das Betriebsverhalten eines Verbrennungsmotors über seine Lebensdauer beschreiben, was von einem Entwickler für Motorsteuergeräte zum Optimieren eines Programms zur Motorsteuerung verwendet werden kann.A company's business may require it to share data with third parties. For example, a vehicle manufacturer may collect operating data from its vehicles in the field and pass this on to a customer for analysis in raw or processed form. For example, such data may describe the operating behavior of an internal combustion engine over its lifetime, which can be used by an engine control unit developer to optimize an engine control program.
Die Weitergabe entsprechender Daten an Drittparteien muss mit Bedacht vollzogen werden. So dürfen keine schützenswerten Informationen nach außen gelangen. Hierzu zählen beispielsweise personenbezogene Daten oder auch Informationen, die neue technische und insbesondere unveröffentlichte Ideen betreffen. Unter Berücksichtigung verschiedener Domänen, beispielsweise unter Berücksichtigung verschiedener Märkte, Fahrzeugtypen, der Art der auszutauschenden Daten, dem Absender, dem Empfänger, dem geltenden Recht oder dergleichen, gilt es, den Umfang und die Art und Weise des Austauschs der Daten anzupassen. Den Datenaustausch betreffende Regeln werden in Form von Vorschriften ausformuliert, die es entsprechend durch alle Beteiligte einzuhalten gilt. Solche Vorschriften können neben Gesetzen auch auf firmeninternen Richtlinien basieren.The transfer of such data to third parties must be carried out with caution. No information requiring protection may be made public. This includes, for example, personal data or information relating to new technical and, in particular, unpublished ideas. Taking into account different domains, for example different markets, vehicle types, the type of data to be exchanged, the sender, the recipient, the applicable law or the like, the scope and manner of data exchange must be adapted. Rules relating to data exchange are formulated in the form of regulations that must be complied with by all parties involved. Such regulations can be based not only on laws but also on internal company guidelines.
Bevor ein solcher Datenaustausch freigegeben werden kann, muss der entsprechende Freigabefall händisch von einer Fachperson überprüft werden, um festzustellen, ob alle Vorschriften eingehalten werden. Aufgrund des zunehmenden Datenumfangs, der gegebenenfalls komplexen einzuhaltenden juristischen Randbedingungen und dem sich von Fall zu Fall stark unterscheidenden Kontext, geht dies mit einem sehr hohen manuellen Aufwand einher. Das Erteilen einer Freigabe dauert somit lange und geht mit hohen Kosten einher. Zudem macht es die Komplexität solcher Datenaustauschvorgänge zunehmend unmöglich, sämtliche hinter einer Entscheidungsfindung zur Freigabe oder Ablehnung eines entsprechenden Datenaustauschs relevanten Entscheidungslogiken nachzuvollziehen. Wird die entsprechende Überprüfung eines solchen Datenfreigabefalls nicht mit ausreichender Sorgfalt durchgeführt, so besteht das Risiko, dass sensible Daten nach Außen gelangen und/oder geltendes Recht verletzt wird. Dies muss vermieden werden.Before such a data exchange can be approved, the corresponding approval case must be checked manually by a specialist to determine whether all regulations are being complied with. Due to the increasing volume of data, the potentially complex legal framework conditions that must be complied with and the context that differs greatly from case to case, this involves a very high level of manual effort. Granting approval therefore takes a long time and is associated with high costs. In addition, the complexity of such data exchange processes makes it increasingly impossible to understand all the relevant decision-making logic behind a decision to approve or reject a corresponding data exchange. If the appropriate review of such a data release case is not carried out with sufficient care, there is a risk that sensitive data will be leaked and/or applicable law will be violated. This must be avoided.
Daher liegt der Bedarf vor, Verfahren und Mittel bereitzustellen, die es ermöglichen den Aufwand für einen Datenaustauschprozess zu reduzieren, und die dabei die Zuverlässigkeit erhöhen, dass alle relevanten Vorschriften eingehalten werden.There is therefore a need to provide procedures and means that make it possible to reduce the effort required for a data exchange process while increasing the reliability that all relevant regulations are complied with.
Aus der
Der vorliegenden Erfindung liegt die Aufgabe zugrunde ein Datenfreigabesystem anzugeben, welches es ermöglicht, Datenfreigabeprozesse unter Erhöhung der Zuverlässigkeit, dass geltende Vorschriften eingehalten werden, zu automatisieren.The present invention is based on the object of providing a data release system which makes it possible to automate data release processes while increasing the reliability that applicable regulations are complied with.
Erfindungsgemäß wird diese Aufgabe durch ein Datenfreigabesystem mit den Merkmalen des Anspruchs 1 gelöst. Vorteilhafte Ausgestaltungen und Weiterbildungen sowie ein Verfahren zum Trainieren eines großen Sprachmodells und ein Verfahren zum Trainieren eines Modells des bestärkenden Lernens ergeben sich aus den hiervon abhängigen Ansprüchen.According to the invention, this object is achieved by a data release system having the features of
Ein gattungsgemäßes Datenfreigabesystem zur Weitergabe von Daten an eine Drittpartei in Übereinkunft mit, eine jeweilige Weitergabe betreffenden Vorschriften, umfassend Mittel zur Verarbeitung der weiterzugebenden Daten mittels künstlicher Intelligenz, wird erfindungsgemäß weitergebildet durch
- - eine Empfangsschnittstelle, dazu eingerichtet einen Freigabefall-Container zu empfangen, umfassend einen Datensatz, eine Datensatzbeschreibung und einen Datensatzkontext, wobei die Datensatzbeschreibung eine Beschreibung des Datensatzes und der Datensatzkontext einen Grund für die Weitergabe des Datensatzes an eine Drittpartei jeweils in computerverarbeitbarer Form umfassen;
- - eine Falldatenbank, umfassend historische Freigabefall-Container, wobei die Empfangsschnittstelle dazu eingerichtet ist einen empfangenen Freigabefall-Container in der Falldatenbank zu speichern;
- - ein Evaluierungsmodul, dazu eingerichtet den Freigabefall-Container und wenigstens einen historischen Freigabefall-Container mittels eines großen Sprachmodells zu verarbeiten, wobei das große Sprachmodell dazu trainiert ist durch einen Vergleich des Freigabefall-Containers mit dem wenigstens einen historischen Freigabefall-Container eine Vorschrifteneinhaltungsbewertung zu erzeugen, umfassend eine Beschreibung in welchem Ausmaß der Freigabefall-Container die die Weitergabe betreffenden Vorschriften erfüllt; und
- - eine Ausgabeschnittstelle, dazu eingerichtet zumindest den Datensatz unter Berücksichtigung der Vorschrifteneinhaltungsbewertung an die Drittpartei weiterzugeben, wenn der Freigabefall-Container den Vorschriften zumindest bis zu einem festgelegten Erfüllungsschwellwert gerecht wird.
- - a receiving interface configured to receive a release case container comprising a data record, a data record description and a data record context, wherein the data record description comprises a description of the data set and the data set context include a reason for transferring the data set to a third party, each in a computer-processable form;
- - a case database comprising historical release case containers, wherein the receiving interface is configured to store a received release case container in the case database;
- - an evaluation module configured to process the release case container and at least one historical release case container using a large language model, wherein the large language model is trained to generate a compliance assessment by comparing the release case container with the at least one historical release case container, comprising a description of the extent to which the release case container complies with the regulations relating to the transfer; and
- - an output interface configured to at least forward the data set to the third party taking into account the compliance assessment if the release case container complies with the regulations at least up to a specified compliance threshold.
Das erfindungsgemäße Datenfreigabesystem ermöglicht somit eine Automatisierung des Datenfreigabe- und Weiterreichungsprozesses. Hierdurch lassen sich bisherige Arbeitsprozesse effizienter ausgestalten und somit Kosten senken. Da relevante Vorschriften automatisch auf ihre Einhaltung überprüft werden, ist es zuverlässig möglich, entsprechende Vorschrifts- bzw. Rechtsverletzungen frühzeitig zu identifizieren und damit zu vermeiden.The data release system according to the invention thus enables the automation of the data release and forwarding process. This allows existing work processes to be made more efficient and thus costs to be reduced. Since relevant regulations are automatically checked for compliance, it is reliably possible to identify corresponding violations of regulations or laws at an early stage and thus avoid them.
Das Datenfreigabesystem wird dabei von einer oder mehreren Recheneinheiten ausgebildet. Es kann sich um alle gängigen Arten von Recheneinheiten handeln, wie insbesondere einen Desktopcomputer, einen Laptop, einen Server oder Serververbund, ein System-On-A-Chip oder dergleichen. Aufgrund des hohen Rechenbedarfs von großen Sprachmodellen eignen sich Hochleistungsrechencluster hierzu besonders. Die Einzelnen logischen Module des erfindungsgemäßen Datenfreigabesystems können auch auf mehrere physische Recheneinheiten aufgeteilt sein. Das Datenfreigabesystem weist entsprechende Schnittstellen zum Empfangen und Weitergeben von Daten auf. Das Datenfreigabesystem weist einen Lesezugriff auf ein computerlesbares Speichermedium auf, auf dem wenigstens ein Computerprogrammprodukt vorgehalten wird, dessen Ausführung durch einen Prozessor des Datenfreigabesystems dieses dazu veranlasst entsprechende Verfahrensschritte auszuführen. Eine Kommunikation innerhalb des Datenfreigabesystems und/oder bevorzugt über die Empfangsschnittstelle und/oder Ausgabeschnittstelle erfolgt bevorzugt durch den Einsatz bewährter kryptografischer Verschlüsselungstechniken abgesichert.The data release system is formed by one or more computing units. These can be all common types of computing units, such as in particular a desktop computer, a laptop, a server or server network, a system-on-a-chip or the like. Due to the high computing requirements of large language models, high-performance computing clusters are particularly suitable for this. The individual logical modules of the data release system according to the invention can also be divided into several physical computing units. The data release system has corresponding interfaces for receiving and forwarding data. The data release system has read access to a computer-readable storage medium on which at least one computer program product is stored, the execution of which by a processor of the data release system causes the processor to carry out corresponding method steps. Communication within the data release system and/or preferably via the receiving interface and/or output interface is preferably secured by the use of proven cryptographic encryption techniques.
Die Empfangsschnittstelle und Ausgabeschnittstelle können dabei von ein und derselben physischen Schnittstelle ausgebildet sein. Es können alle gängigen Datenübertragungstechniken und Kommunikationsprotokolle Anwendung finden. Insbesondere erfolgt ein Datenaustausch automatisiert unter Nutzung bewährter Anwendungsprogrammierschnittstellen, auch als Application-Programming-Interface (API) bezeichnet. Über die Empfangsschnittstelle empfängt das Datenfreigabesystem einen Freigabefall-Container. Der Freigabefall-Container kann händisch von einem Nutzer zusammengestellt werden oder auch automatisiert von einem Computersystem. Der Freigabefall-Container umfasst den mit der Drittpartei auszutauschenden Datensatz sowie für jeden Datensatz eine Datensatzbeschreibung und einen Datensatzkontext. Bei der Datensatzbeschreibung und dem Datensatzkontext kann es sich um zwei separate computerlesbare Dateien handeln. Diese Dateien können jedes erdenkliche Format aufweisen und in allen gängigen Kodierungen kodiert sein. Insbesondere umfassen die Datensatzbeschreibung und der Datensatzkontext die jeweilige Beschreibung bzw. den Grund für die Weitergabe in Form eines sprachlich ausformulierten Textes. Die den Datensatz ausbildenden Informationen können ebenfalls alle erdenklichen Dateiformate annehmen. Es kann sich beispielsweise um Textdateien, eine Tabelle wie ein XML-Dokument, Sensordaten, Fotos, Videos, CAD-Daten, Simulationsdaten wie Ergebnisse einer CFD-Simulation oder einer FEM-Simulation, einen Sourcecode eines Programms oder dergleichen handeln.The receiving interface and output interface can be formed by one and the same physical interface. All common data transmission technologies and communication protocols can be used. In particular, data exchange is automated using proven application programming interfaces, also known as application programming interfaces (APIs). The data release system receives a release case container via the receiving interface. The release case container can be put together manually by a user or automatically by a computer system. The release case container contains the data set to be exchanged with the third party as well as a data set description and a data set context for each data set. The data set description and the data set context can be two separate computer-readable files. These files can have any conceivable format and be encoded in all common codings. In particular, the data set description and the data set context contain the respective description or the reason for the transfer in the form of a verbally formulated text. The information forming the data set can also take on any conceivable file format. For example, it can be text files, a table such as an XML document, sensor data, photos, videos, CAD data, simulation data such as results of a CFD simulation or a FEM simulation, a source code of a program or the like.
Die Datensatzbeschreibung beschreibt dabei insbesondere um welche Art von Daten es sich handelt, welchen Umfang diese aufweisen, in welchem Format sie vorliegen, wie viel Speicherplatz der jeweilige Datensatz beansprucht und dergleichen. Somit können die Metadaten einer computerlesbaren Datei zur Ausbildung oder Ergänzung der Datensatzbeschreibung verwendet werden. Neben dem Grund für die Weitergabe kann der Datensatzkontext auch beschreiben innerhalb welches Zielmarktes bzw. Domäne der Datenaustausch erfolgt. Ergänzende Informationen können beispielsweise beschreiben von welchem Sender der Datensatz versendet wird, im Rahmen welchen Projekts der Datenaustausch erfolgt, für welchen Empfänger der Datensatz vorgesehen ist und dergleichen. Zusammengefasst dienen die Datensatzbeschreibung und der Datensatzkontext dazu, alle für einen entsprechenden Datenaustausch relevanten Attribute zu beschreiben.The dataset description describes in particular what type of data is involved, what volume it has, what format it is in, how much storage space the respective dataset requires, and the like. The metadata of a computer-readable file can therefore be used to create or supplement the dataset description. In addition to the reason for the transfer, the dataset context can also describe within which target market or domain the data exchange takes place. Additional information can, for example, describe which sender the dataset is being sent from, within which project the data exchange takes place, which recipient the dataset is intended for, and the like. In summary, the dataset description and the dataset context serve to describe all attributes relevant to a corresponding data exchange.
In der Falldatenbank werden historische Freigabefall-Container gespeichert. Jedes Mal, wenn über die Empfangsschnittstelle ein Freigabefall-Container empfangen wird, kann dieser in der Falldatenbank ergänzt werden und somit als neuer historischer Freigabefall-Container aufgefasst werden.Historical release case containers are stored in the case database. Every time a release case container is received via the receiving interface, it can be added to the case database and thus viewed as a new historical release case container.
Das Evaluierungsmodul setzt künstliche Intelligenz in Form eines generativen, vortrainierten Transformers, auch als Generative Pretrained Transformer bezeichnet (GPT), mit einem großen Sprachmodell, auch als Large Language Model (LLM) bezeichnet, ein, um Freigabefall-Container mit historischen Freigabefall-Containern zu vergleichen. Das große Sprachmodell verarbeitet dabei den Datensatz, die Datensatzbeschreibung und den Datensatzkontext der zu vergleichenden Freigabefall-Container. Es ist dabei auch denkbar, dass das große Sprachmodell in Abhängigkeit von im Datensatz erkannter Informationen die Datensatzbeschreibung und/oder den Datensatzkontext ergänzt oder korrigiert. Das große Sprachmodell ist dabei dazu in der Lage, Bewertungsmuster in den historischen Freigabefall-Containern zu erkennen, welche das große Sprachmodell dazu in die Lage versetzen, anhand des Inhalts des Freigabefall-Containers zu klassifizieren, ob der Freigabefall-Container für den Datenaustausch freigegeben werden darf oder abgelehnt werden muss. Dabei muss das große Sprachmodell die relevanten Vorschriften selbst nicht kennen. Das Ergebnis der durch das große Sprachmodell vorgenommen Bewertung wird in Form der Vorschrifteneinhaltungsbewertung ausgegeben. Bei der Vorschrifteneinhaltungsbewertung handelt es sich ebenfalls um eine computerverarbeitbare Information, insbesondere in Form einer separaten computerlesbaren Datei. Diese Datei kann ebenfalls in beliebigen geeigneten Dateiformaten vorliegen. Insbesondere umfasst die Vorschrifteneinhaltungsbewertung eine Zusammenfassung der Bewertung des Freigabefall-Containers durch das große Sprachmodell in Form eines menschenlesbaren Textes. Basierend auf der Vorschrifteneinhaltungsbewertung kann zudem eine Risikobewertung vorgenommen werden und ein sogenanntes Audit-Log erzeugt werden, welche den Freigabefallbewertungsprozess durch das Evaluierungsmodul zusammenfasst. Eine Vorschrifteneinhaltungsbewertung kann in einen Freigabefall-Container hinzugefügt werden.The evaluation module uses artificial intelligence in the form of a generative, pre-trained transformer (GPT) with a large language model (LLM) to compare release case containers with historical release case containers. The large language model processes the data set, the data set description and the data set context of the release case containers to be compared. It is also conceivable that the large language model supplements or corrects the data set description and/or the data set context depending on information recognized in the data set. The large language model is able to recognize evaluation patterns in the historical release case containers, which enable the large language model to classify, based on the content of the release case container, whether the release case container may be released for data exchange or must be rejected. The large language model does not have to know the relevant regulations itself. The result of the assessment performed by the large language model is output in the form of the compliance assessment. The compliance assessment is also computer-processable information, in particular in the form of a separate computer-readable file. This file can also be in any suitable file format. In particular, the compliance assessment includes a summary of the assessment of the release case container by the large language model in the form of a human-readable text. Based on the compliance assessment, a risk assessment can also be performed and a so-called audit log can be generated, which summarizes the release case assessment process by the evaluation module. A compliance assessment can be added to a release case container.
Das Datenfreigabesystem ist dazu in der Lage, durch das Evaluierungsmodul bewertete Freigabefall-Container in Abhängigkeit des Ausmaßes, wie sehr die geltenden Vorschriften eingehalten werden, automatisch an relevante Drittparteien weiterzuleiten. Hierzu kann das Evaluierungsmodul das Ausmaß beispielsweise in Form einer Prozentangabe oder einer Zahl innerhalb eines festgelegten Wertebereichs definieren. Anschließend vergleicht das Datenfreigabesystem dieses Ausmaß mit dem festgelegten Erfüllungsschwellwert. Übersteigt das Ausmaß den Erfüllungsschwellwert, so kann der Freigabefall-Container bzw. zumindest der im Freigabefall-Container enthaltende Datensatz an die Drittpartei weitervermittelt werden. Beispielsweise können entsprechende Daten über das Internet übertragen werden. Der Erfüllungsschwellwert kann individuell für verschiedene Freigabefälle angepasst werden. Dies kann ebenfalls automatisch durch ein Computersystem erfolgen oder aber per Hand durch einen Nutzer.The data release system is able to automatically forward release case containers evaluated by the evaluation module to relevant third parties depending on the extent to which the applicable regulations are complied with. To do this, the evaluation module can define the extent, for example, in the form of a percentage or a number within a specified range of values. The data release system then compares this extent with the specified compliance threshold. If the extent exceeds the compliance threshold, the release case container or at least the data set contained in the release case container can be forwarded to the third party. For example, corresponding data can be transmitted over the Internet. The compliance threshold can be individually adjusted for different release cases. This can also be done automatically by a computer system or manually by a user.
Eine vorteilhafte Weiterbildung des erfindungsgemäßen Datenfreigabesystems zeichnet sich aus durch:
- - eine Überprüfungsschnittstelle, dazu eingerichtet den Freigabefall-Container und die Vorschrifteneinhaltungsbewertung an einen Nutzer auszugeben und eine Vorschrifteneinhaltungsaussage von dem Nutzer zu empfangen, wobei die Vorschrifteneinhaltungsaussage eine durch den Nutzer bestätigte, abgelehnte oder korrigierte Vorschrifteneinhaltungsbewertung umfasst; und
- - ein Lernmodul, dazu eingerichtet die Vorschrifteneihaltungsaussage in den Freigabefall-Container zu inkludieren und durch den Einsatz eines Modells des bestärkenden Lernens in Abhängigkeit des Inhalts der Vorschrifteneinhaltungsaussage eine Eingabeaufforderung für das große Sprachmodell zu formulieren und diese an das Evaluierungsmodul für die nächste Evaluierung eines Freigabefall-Containers zu übermitteln.
- - a verification interface configured to issue the release case container and the compliance assessment to a user and to receive a compliance statement from the user, the compliance statement comprising a compliance assessment confirmed, rejected or corrected by the user; and
- - a learning module designed to include the compliance statement in the release case container and, by using a reinforcement learning model, to formulate a prompt for the large language model depending on the content of the compliance statement and to transmit this to the evaluation module for the next evaluation of a release case container.
Es ist davon auszugehen, dass das große Sprachmodell, insbesondere wenn es erstmalig seine Arbeit aufnimmt, Fehler bei der Bewertung entsprechender Freigabefall-Container macht. Durch das Vorsehen der Überprüfungsschnittstelle und des Lernmoduls ist es möglich, einen Lernprozess in Gang zu setzen, um die Zuverlässigkeit zu erhöhen, dass das große Sprachmodell jeweilige Freigabefall-Container zuverlässiger bewertet.It can be assumed that the large language model, especially when it first starts working, will make errors when evaluating corresponding release case containers. By providing the verification interface and the learning module, it is possible to initiate a learning process in order to increase the reliability that the large language model evaluates respective release case containers more reliably.
Die Überprüfungsschnittstelle kann analog zur Empfangsschnittstelle und/oder Ausgabeschnittstelle ausgeführt sein. Bei dem Nutzer handelt es sich insbesondere um eine mit den geltenden Vorschriften betraute bzw. fachkundige Person wie einen Juristen. Der Nutzer ist dazu in der Lage, die Bewertung des Freigabefall-Containers durch das große Sprachmodell zu überprüfen und somit die Vorschrifteneinhaltungsbewertung entsprechend zu bestätigen, abzulehnen oder zu korrigieren. Als Ergebnis stellt der Nutzer die Vorschrifteneinhaltungsaussage bereit. Im einfachsten Falle handelt es sich dabei um die Vorschrifteneinhaltungsbewertung, welche durch eine entsprechende Analyseinformation durch den Nutzer ergänzt wird. Diese Analyseinformation kann in Form eines Markers aufgefasst werden, der beschreibt, ob die Vorschrifteneinhaltungsbewertung bestätigt, abgelehnt oder korrigiert wurde. Korrekturen können dabei insbesondere hervorgehoben werden. Besonders bevorzugt umfasst die Vorschrifteneinhaltungsaussage auch eine Erklärung dafür, warum und wie der Nutzer die Vorschrifteneinhaltungsbewertung entsprechend bestätigt, abgelehnt oder korrigiert hat.The verification interface can be designed analogously to the receiving interface and/or output interface. The user is in particular a person who is entrusted with the applicable regulations or is an expert, such as a lawyer. The user is able to check the assessment of the release case container by the large language model and thus confirm, reject or correct the compliance assessment accordingly. As a result, the user provides the compliance statement. In the simplest case, this is the compliance assessment, which is carried out by an appropriate analysis in information is supplemented by the user. This analysis information can be understood in the form of a marker that describes whether the compliance assessment was confirmed, rejected or corrected. Corrections can be highlighted in particular. It is particularly preferred that the compliance statement also includes an explanation of why and how the user confirmed, rejected or corrected the compliance assessment accordingly.
Das Lernmodul verarbeitet die Vorschrifteneinhaltungsaussage und ist durch ein entsprechend trainiertes Modell des bestärkenden Lernens dazu fähig, in Abhängigkeit des Inhalts der Vorschrifteneinhaltungsaussage entsprechende Eingabeaufforderungen für das große Sprachmodell anzupassen. Eine Eingabeaufforderung wird auch als Prompt bezeichnet. Über ein solches Prompt lässt sich die Arbeitsweise eines großen Sprachmodells gezielt beeinflussen.The learning module processes the compliance statement and, thanks to a suitably trained reinforcement learning model, is able to adapt appropriate input prompts for the large language model depending on the content of the compliance statement. An input prompt is also known as a prompt. Such a prompt can be used to specifically influence the way a large language model works.
Bevorzugt ist dabei das Evaluierungsmodul dazu eingerichtet die Vorschrifteneinhaltungsbewertung für einen Freigabefall-Container unter Berücksichtigung einer vom Lernmodul formulierten Eingabeaufforderung und/oder einer in den Freigabefall-Container oder einen historischen Freigabefall-Container inkludierten Vorschrifteneinhaltungsaussage zu erzeugen. Das große Sprachmodell kann hierdurch die Zuverlässigkeit einer korrekten Bewertung des aktuell zu klassifizierenden Freigabefall-Containers erhöhen. Dabei handelt es sich um einen iterativen Prozess, wobei mit jeder Iteration die Klassifizierungsfähigkeit des großen Sprachmodells erhöht wird. Das große Sprachmodell ist dabei selbst dazu in der Lage, die vom Nutzer generierte Vorschrifteneinhaltungsaussage zu verarbeiten und somit Muster zu identifizieren, welche zu Abweichungen zwischen der Vorschrifteneinhaltungsbewertung und der Vorschrifteneinhaltungsaussage führen. Dies versetzt das große Sprachmodell dazu in die Lage, Freigabefall-Container wie der Nutzer zu klassifizieren. Von Iteration zu Iteration steigt die Anzahl verwerteter Vorschrifteneinhaltungsaussagen, sodass die Bewertungsgüte des großen Sprachmodells mit der Zeit immer besser wird.Preferably, the evaluation module is set up to generate the compliance assessment for a release case container taking into account an input prompt formulated by the learning module and/or a compliance statement included in the release case container or a historical release case container. The large language model can thereby increase the reliability of a correct assessment of the release case container currently to be classified. This is an iterative process, with each iteration increasing the classification ability of the large language model. The large language model itself is able to process the compliance statement generated by the user and thus identify patterns that lead to deviations between the compliance assessment and the compliance statement. This enables the large language model to classify release case containers like the user. From iteration to iteration, the number of compliance statements evaluated increases, so that the evaluation quality of the large language model improves over time.
Eine weitere vorteilhafte Ausgestaltung des erfindungsgemäßen Datenfreigabesystems sieht ferner vor, dass das Evaluierungsmodul dazu eingerichtet ist, mittels des großen Sprachmodells im Zuge der Erzeugung der Vorschrifteneinhaltungsbewertung eine Referenzinformation zu erzeugen, umfassend wenigstens eine Referenz zu einem historischen Freigabefall-Container, auf dessen Ausmaß des Erfüllens der Vorschriften basierend, das große Sprachmodell die Vorschrifteneinhaltungsbewertung für den Freigabefall-Container erzeugt. Mit anderen Worten kann das Evaluierungsmodul einem Nutzer somit einen Hinweis auf relevante vormalige Datenfreigabefälle präsentieren, auf deren Bewertung die Klassifizierung des aktuell betrachteten Freigabefall-Containers beruht. Entsprechend referenzierte historische Freigabefall-Container weisen somit Ähnlichkeiten im Datensatz, der Datensatzbeschreibung und/oder den Datensatzkontext auf.A further advantageous embodiment of the data release system according to the invention further provides that the evaluation module is set up to generate reference information using the large language model in the course of generating the regulatory compliance assessment, comprising at least one reference to a historical release case container, based on the extent to which the regulations are met, the large language model generates the regulatory compliance assessment for the release case container. In other words, the evaluation module can thus present a user with a reference to relevant previous data release cases, on the assessment of which the classification of the currently considered release case container is based. Correspondingly referenced historical release case containers thus have similarities in the data set, the data set description and/or the data set context.
Entsprechend einer weiteren vorteilhaften Ausgestaltung des erfindungsgemäßen Datenfreigabesystems weist dieses eine Vorschriftendatenbank auf, umfassend die Weitergabe von Daten betreffende Vorschriften, wobei die Vorschriftendatenbank dazu eingerichtet ist neue Vorschriften aufzunehmen und/oder eine bereits gespeicherte Vorschrift durch eine aktualisierte Vorschrift anzupassen, und wobei das Evaluierungsmodul dazu eingerichtet ist die Vorschrifteneinhaltungsbewertung für einen Freigabefall-Container unter Berücksichtigung der in der Vorschriftendatenbank vorgehaltenen Vorschriften zu erzeugen. Somit ist es nicht nur möglich, die Bewertung eines jeweiligen Freigabefall-Containers alleinig basierend auf den durch den Vergleich des Freigabefall-Containers mit historischen Freigabefall-Containern identifizierten Mustern zu klassifizieren, sondern das große Sprachmodell kann auch die jeweiligen relevanten Vorschriften direkt auslesen und berücksichtigen. Die Vorschriften können dabei in Form von natürlicher Sprache ausformuliert sein. Aufgrund seiner Fähigkeiten in Sprache ausformulierte Texte zu verarbeiten und „zu verstehen“, kann das große Sprachmodell somit noch zuverlässiger prüfen, ob jeweilige Freigabefall-Container tatsächlich den aktuell gelten Vorschriften gerecht werden oder nicht.According to a further advantageous embodiment of the data release system according to the invention, it has a regulations database, comprising regulations relating to the transfer of data, wherein the regulations database is set up to include new regulations and/or to adapt an already stored regulation with an updated regulation, and wherein the evaluation module is set up to generate the regulatory compliance assessment for a release case container taking into account the regulations held in the regulations database. Thus, it is not only possible to classify the assessment of a respective release case container based solely on the patterns identified by comparing the release case container with historical release case containers, but the large language model can also directly read out and take into account the respective relevant regulations. The regulations can be formulated in the form of natural language. Due to its ability to process and "understand" texts formulated in language, the large language model can thus check even more reliably whether respective release case containers actually comply with the currently applicable regulations or not.
Entsprechend kann die Vorschrifteneinhaltungsbewertung nicht nur eine Prozentangabe oder eine Zahl aus einem festgelegten Wertebereich umfassen, um das Ausmaß zu beschreiben, wie sehr die jeweiligen Vorschriften eingehalten werden, sondern das Evaluierungsmodul kann einen direkten Bezug zwischen dem aktuellen Freigabefall-Container und den Vorschriften herstellen. Beispielsweise kann die Vorschrifteneinhaltungsbewertung für einige oder alle zu berücksichtigende Vorschriften eine textuelle Erläuterung umfassen, wieso und in welchem Ausmaß genau diese Vorschrift eingehalten wird oder nicht. Die textuelle Erläuterung kann auch durch Grafiken oder Diagramme angereichert sein.Accordingly, the compliance assessment can not only include a percentage or a number from a specified range of values to describe the extent to which the respective regulations are complied with, but the evaluation module can establish a direct link between the current release case container and the regulations. For example, the compliance assessment can include a textual explanation for some or all of the regulations to be considered, why and to what extent exactly this regulation is complied with or not. The textual explanation can also be enriched with graphics or diagrams.
Die Vorschriftendatenbank kann aktualisierbar sein. So können neue Vorschriften ergänzt werden und/oder alte Vorschriften aktualisiert werden. Durch eine direkte Berücksichtigung der Vorschriften wird die Zuverlässigkeit noch weiter erhöht, dass das große Sprachmodell jeweilige Freigabefall-Container korrekt bewertet.The regulations database can be updated. This means that new regulations can be added and/or old regulations updated. By directly taking the regulations into account, the reliability that the large language model correctly evaluates the respective release case containers is increased even further.
Eine weitere vorteilhafte Ausgestaltung des erfindungsgemäßen Datenfreigabesystems sieht ferner vor, dass das Evaluierungsmodul dazu eingerichtet ist einen historischen Freigabefall-Container durch das Erzeugen der Vorschrifteneinhaltungsbewertung unter Berücksichtigung neuer und/oder ergänzter Vorschriften und/oder eines geänderten Inhalts des respektiven historischen Freigabefall-Containers neu zu bewerten. Ändern sich die Vorschriften und/oder der Inhalt eines historischen Freigabefall-Containers, kann dies eine Neubewertung eines älteren Datenaustauschfalls erfordern. Das Datenfreigabesystem ist erfindungsgemäß dazu in der Lage, historische Freigabefall-Container, also vormalige Datenaustauschprozesse, neu zu bewerten. So können Maßnahmen eingeleitet werden, sollten in einem vormaligen Datenaustauschfall entsprechende Vorschriften nun nicht mehr eingehalten werden. Ein solcher Datenaustauschfall kann beispielsweise das regelmäßige Übermitteln neu anfallender Daten an eine entsprechende Drittpartei vorsehen. Entsprechend kann der nächste Datenübertragungszyklus an die Drittpartei pausiert, gestoppt werden oder angepasst werden.A further advantageous embodiment of the data release system according to the invention further provides that the evaluation module is set up to re-evaluate a historical release case container by generating the compliance assessment taking into account new and/or supplemented regulations and/or a changed content of the respective historical release case container. If the regulations and/or the content of a historical release case container change, this may require a re-evaluation of an older data exchange case. According to the invention, the data release system is able to re-evaluate historical release case containers, i.e. previous data exchange processes. In this way, measures can be initiated if corresponding regulations are no longer complied with in a previous data exchange case. Such a data exchange case can, for example, provide for the regular transmission of newly generated data to a corresponding third party. The next data transmission cycle to the third party can be paused, stopped or adjusted accordingly.
Das Datenfreigabesystem kann ein Skript ausführen, welches in Abhängigkeit geänderter Vorschriften und/oder eines geänderten Inhalts des historischen Freigabefall-Containers relevante Datenaustauschfälle auffindet.The data release system can execute a script that finds relevant data exchange cases depending on changed regulations and/or a changed content of the historical release case container.
Entsprechend einer weiteren vorteilhaften Ausgestaltung des erfindungsgemäßen Datenfreigabesystems ist das Evaluierungsmodul dazu eingerichtet, Vorschriften in Abhängigkeit von durch die Verarbeitung eines Freigabefall-Containers und/oder eines historischen Freigabefall-Containers identifizierte Bewertungsmuster zu formulieren, selbst formulierte Vorschriften mit den in der Vorschriftendatenbank vorgehaltenen Vorschriften abzugleichen und eine selbst formulierte Vorschrift in der Vorschriftendatenbank zu ergänzen, wenn die selbst formulierte Vorschrift über ein festgelegtes Maß von sämtlichen bisher in der Vorschriftendatenbank vorgehaltenen Vorschriften abweicht. Wie bereits erwähnt, ist das große Sprachmodell dazu in der Lage, Freigabefall-Container allein durch den Vergleich mit historischen Freigabefall-Containern zu bewerten. Dies wird durch das Identifizieren entsprechender Bewertungsmuster ermöglicht. Diese Bewertungsmuster können vom großen Sprachmodell zu neuen Vorschriften ausformuliert werden und diese in der Vorschriftendatenbank ergänzt werden. Auch ist es denkbar, bestehende Vorschriften durch das große Sprachmodell zu überarbeiten. Dies ermöglicht es einem Betreiber des Datenfreigabesystems zuverlässig und mit geringem Aufwand relevante Vorschriften, über die der Betreiber noch nicht ausreichend gewahr ist, transparent aufzudecken und in die Vorschriftendatenbank aufzunehmen. Eine Aufnahme solcher selbst formulierten Vorschriften in die Vorschriftendatenbank erfolgt bevorzugt nur dann, wenn sich die jeweiligen selbst formulierten Vorschriften fundamental von bereits bekannten Vorschriften unterscheiden, und nicht nur durch Kleinigkeiten wie Schreibfehler, eine abweichende Grammatik oder dergleichen.According to a further advantageous embodiment of the data release system according to the invention, the evaluation module is set up to formulate regulations depending on evaluation patterns identified by processing a release case container and/or a historical release case container, to compare self-formulated regulations with the regulations held in the regulations database and to supplement a self-formulated regulation in the regulations database if the self-formulated regulation deviates by a specified amount from all regulations previously held in the regulations database. As already mentioned, the large language model is able to evaluate release case containers solely by comparing them with historical release case containers. This is made possible by identifying corresponding evaluation patterns. These evaluation patterns can be formulated into new regulations by the large language model and these can be supplemented in the regulations database. It is also conceivable to revise existing regulations using the large language model. This enables an operator of the data release system to reliably and with little effort transparently uncover relevant regulations of which the operator is not yet sufficiently aware and to include them in the regulations database. Such self-formulated regulations are preferably only included in the regulations database if the respective self-formulated regulations differ fundamentally from already known regulations, and not just due to minor details such as spelling mistakes, different grammar or the like.
Bei einem Verfahren zum Trainieren eines von einem Evaluierungsmodul eines im vorigen beschriebenen Datenfreigabesystems einsetzbaren großen Sprachmodells ist es erfindungsgemäß vorgesehen, dass das große Sprachmodell die selbst erzeugte Vorschrifteneinhaltungsbewertung und die vom Nutzer erzeugte Vorschrifteneinhaltungsaussage für denselben Freigabefall-Container einliest, wobei das große Sprachmodell die Vorschrifteneinhaltungsaussage als Grundwahrheit betrachtet. Dies ermöglicht ein fortwährendes Training des großen Sprachmodells. So vergleicht das große Sprachmodell die selbst erzeugte Vorschrifteneinhaltungsbewertung mit der Vorschrifteneinhaltungsaussage und ist somit dazu in der Lage nachzuvollziehen, welche Aspekte einer Überprüfung, ob jeweilige Freigabefall-Container die geltenden Vorschriften erfüllen oder nicht, korrekt angewendet wurden und welche nicht. Das große Sprachmodell kann somit sein Vorgehen zum Bewerten bzw. Klassifizieren von Freigabefall-Container optimieren.In a method for training a large language model that can be used by an evaluation module of a data release system described above, the invention provides that the large language model reads in the self-generated compliance assessment and the user-generated compliance statement for the same release case container, with the large language model considering the compliance statement as the ground truth. This enables continuous training of the large language model. The large language model compares the self-generated compliance assessment with the compliance statement and is thus able to understand which aspects of a check as to whether respective release case containers comply with the applicable regulations or not were applied correctly and which were not. The large language model can thus optimize its procedure for evaluating or classifying release case containers.
Ein Verfahren zum Trainieren eines von einem Lernmodul eines im vorigen beschriebenen Datenfreigabesystems einsetzbaren Modells des bestärkenden Lernens weist erfindungsgemäß die folgenden Verfahrensschritte auf:
- - Einlesen der vom Nutzer erzeugten Vorschrifteneinhaltungsaussage in das Modell des bestärkenden Lernens;
- - Abändern der für das große Sprachmodell formulierten Eingabeaufforderung, wenn die Vorschrifteneinhaltungsaussage eine Änderung oder eine Ablehnung der vom großen Sprachmodell erzeugten Vorschrifteneinhaltungsbewertung umfasst; und
- - erneutes Durchführen der beiden vorigen Verfahrensschritte solange, bis die Vorschrifteneinhaltungsaussage eine Bestätigung der Vorschrifteneinhaltungsbewertung umfasst.
- - Reading the user-generated compliance statement into the reinforcement learning model;
- - modifying the prompt formulated for the large language model if the compliance statement involves a change or rejection of the compliance assessment generated by the large language model; and
- - repeating the two previous steps until the compliance statement includes a confirmation of the compliance assessment.
Somit kann nicht nur das große Sprachmodell selbst weitertrainiert werden, sondern die Funktionsweise des großen Sprachmodells mit Hilfe des Modells des bestärkenden Lernens nach und nach angepasst werden. Durch das Training wird das Modell des bestärkenden Lernens dabei gezielt dazu in die Lage versetzt, immer zutreffendere Eingabeaufforderungen für das große Sprachmodell auszuformulieren.This means that not only can the large language model itself be further trained, but the way the large language model works can also be gradually adapted with the help of the reinforcement learning model. Through training, the reinforcement learning model is specifically enabled to formulate increasingly accurate input prompts for the large language model.
Weitere vorteilhafte Ausgestaltungen des erfindungsgemäßen Datenfreigabesystems sowie des Verfahrens zum Trainieren des großen Sprachmodells und des Modells des bestärkenden Lernens ergeben sich auch aus den Ausführungsbeispielen, welche nachfolgend unter Bezugnahme auf die Figuren näher beschrieben werden.Further advantageous embodiments of the data release system according to the invention and of the method for training the large language model and the reinforcement learning model also emerge from the embodiments which are described in more detail below with reference to the figures.
Dabei zeigen:
-
1 eine schematische Darstellung des von einem erfindungsgemäßen Datenfreigabesystems ausgeführten Verfahrensablaufs; und -
2 eine schematische Darstellung des erfindungsgemäßen Datenfreigabesystems.
-
1 a schematic representation of the process sequence carried out by a data release system according to the invention; and -
2 a schematic representation of the data release system according to the invention.
Das Weiterreichen von firmeninternen Daten an eine externe Stelle unterliegt bestimmten Vorschriften. Mit Hilfe eines in
Zuerst wird ein Freigabefall-Container erzeugt, umfassend einen an eine Drittpartei weiterzureichenden Datensatz sowie eine Datensatzbeschreibung und einen Datensatzkontext. Der Freigabefall-Container wird dem Datenfreigabesystem 1 in Schritt 101 zugeführt.First, a release case container is created, comprising a data set to be passed on to a third party, as well as a data set description and a data set context. The release case container is fed to the
Der Freigabefall-Container wird in einem Schritt 102 in einer Falldatenbank 3 gespeichert. In der Falldatenbank 3 sind vormalige Freigabefall-Container, in diesem Kontext als historische Freigabefall-Container bezeichnet, gespeichert.The release case container is stored in a
Historische Freigabefall-Container weisen bereits eine Bewertung auf, inwieweit jeweilige Vorschriften eingehalten werden. Diese Beschreibung kann durch eine Erklärung angereichert sein, beschreibend wieso die entsprechende Bewertung in diesem Ausmaß erfolgte.Historical release case containers already contain an assessment of the extent to which the respective regulations are complied with. This description can be supplemented by an explanation describing why the corresponding assessment was made to this extent.
In einem Schritt 103 erfolgt eine Bewertung des Freigabefall-Containers mittels eines von einem Evaluierungsmodul 4 ausgeführten großen Sprachmodells LLM. Das große Sprachmodell LLM ist dazu in der Lage durch Analyse historischer Freigabefall-Container entsprechende Bewertungsmuster zu identifizieren und diese auf den aktuellen Freigabefall-Container anzuwenden. Das Ergebnis des großen Sprachmodells LLM wird in Form einer Vorschrifteneinhaltungsbewertung zusammengefasst.In a
Das große Sprachmodell LLM kann dabei in einem Schritt 104 eine Referenzinformation erzeugen, die auf für den aktuellen Freigabefall-Container relevante historische Freigabefall-Container verweist. Dabei werden solche historischen Freigabefall-Container referenziert, deren Bewertungsschema für den aktuellen Freigabefall-Container angewendet wurde. Dies erlaubt es einem Betreiber des Datenfreigabesystems 1 schnell und einfach die Bewertungsweise des großen Sprachmodell LLM nachzuvollziehen sowie vormalige Datenaustauchfälle erneut zu überprüfen.In a
In einem Schritt 105 kann eine Überprüfung des Bewertungsergebnisses des großen Sprachmodells LLM durch einen Nutzer 7 erfolgen. Bei dem Nutzer 7 handelt es sich insbesondere um eine mit den Vorschriften vertraute Person wie einen Juristen. So analysiert der Nutzer 7 die Vorschrifteneinhaltungsbewertung und reichert diese durch eine Information an. Diese Information beschreibt, ob die Vorschrifteneinhaltungsbewertung abgelehnt, bestätigt oder korrigiert wurde, insbesondere in welchem Umfang. Hierdurch wird eine Vorschrifteneinhaltungsaussage 11 generiert.In a
Die Vorschrifteneinhaltungsaussage 11 kann dem großen Sprachmodell LLM für ein beständiges Weitertrainieren zugeführt werden. Auch kann ein Modell des bestärkenden Lernens REM vorgesehen sein, welches zum Anpassen der Eingabeaufforderung für das große Sprachmodell LLM dient. Die Abkürzung REM steht dabei für Reinforcement-Learning-Model.The
Das große Sprachmodell LLM kann in Schritt 106 die selbst identifizierten Bewertungsmuster in Form von neuen Vorschriften ausformulieren und diese in einer Vorschriftendatenbank 9 ergänzen. Auch kann das große Sprachmodell LLM bestehende Vorschriften überarbeiten.In
In Schritt 107 wird eine finale Bewertung des Freigabefall-Containers erhalten. Neben dem Erfüllungsgrad der relevanten Vorschriften kann diese Information auch eine Risikobewertung und/oder ein sogenanntes Audit-Log umfassen. In Schritt 108 ist die Freigabewertung des Freigabefall-Containers abgeschlossen und der jeweilige Freigabefall-Container kann gegebenenfalls, sollte er die relevanten Vorschriften ausreichend erfüllen, automatisch an eine besagte Drittpartei weitervermittelt werden. Gegebenenfalls muss dies erst manuell bestätigt werden.In
Über die Empfangsschnittstelle 2 empfangene Freigabefall-Container werden nun dem Evaluierungsmodul 4 zugeführt und durch das große Sprachmodell LLM bewertet. Diese Bewertung in Form der Vorschrifteneinhaltungsbewertung kann dann dem Nutzer 7 sowie dem Lernmodul 8 zugeführt werden. Der Nutzer 7 kontrolliert und korrigiert gegebenenfalls die Bewertung des großen Sprachmodells LLM. Diese Bewertung liegt in Form einer Vorschrifteneinhaltungsaussage 11 vor. Informationen werden dabei dem Nutzer 7 über eine Überprüfungsschnittstelle 6 zugespielt bzw. von diesem Empfangen. Die Überprüfungsschnittstelle 6 könnte ebenfalls in das Service- und Ticketingsystem integriert sein.Release case containers received via the receiving interface 2 are now fed to the
Die Vorschrifteneinhaltungsaussage 11 kann dem Lernmodul 8 zum Weitertrainieren des Modells des bestärkenden Lernens REM zugeführt werden. Das Modell des bestärkenden Lernens REM formuliert dann neue Eingabeaufforderungen für das große Sprachmodell LLM.The
Das große Sprachmodell LLM kann auf die Vorschriftendatenbank 9 zugreifen, um jeweilige Vorschriften zu beziehen und zur Erzeugung der Vorschrifteneinhaltungsbewertung zu berücksichtigen. Selbst neu generierte Vorschriften können in der Vorschriftendatenbank 9 ergänzt werden. Das Datenfreigabesystem 1 kann ein Skript 12 ausführen, welches die Aufnahme neuer Vorschriften in die Vorschriftendatenbank 9 erkennt und durch einen Vergleich mit in der Falldatenbank 3 vorgehaltenen historischen Freigabefall-Containern solche vormaligen Austauschfälle identifiziert, die anhand der neuen Vorschriften neu bewertet werden müssen.The large language model LLM can access the
Angedeutet durch einen Pfeil 201 können Anwender über das Service- und Ticketingsystem die Falldatenbank 3 auslesen und somit alle für jeweilige Austauschfälle relevanten Informationen auch nachträglich händisch überprüfen. Angedeutet durch einen Pfeil 202 werden nach Bedarf (auch automatisch durch das Skript 12) neue Anfragen 10 für besagte historische Freigabefall-Container übermittelt.Indicated by an
Mit Hilfe des erfindungsgemäßen Datenfreigabesystems lässt sich der Aufwand zur Bewertung entsprechender Datenaustauschfälle auf ein Minimum reduzieren. Neue Datenaustauschfälle können somit durch fachkundige Personen schnell überprüft werden. Um Fehler zu vermeiden, kann es dabei auch erforderlich sein, dass zuerst eine manuelle Freigabe eines durch das Datenfreigabesystem 1 freigegebenen Datenaustauschfalls erfolgen muss. Datenaustauschfälle lassen sich zuverlässig bewerten, da, bedingt durch die Fähigkeit große Datenmengen in kurzer Zeit zu verarbeiten, eine Vielzahl vormaliger Bewertungen von historischen Freigabefall-Container berücksichtigt werden können. Zudem ist es möglich das Bewertungsschema des großen Sprachmodells LLM durch ein beständiges Training zu optimieren. Ferner lassen sich neue Vorschriften durch das Datenfreigabesystem 1 nahezu in Echtzeit ableiten. Änderungen des geltenden Rechts können schnell und zuverlässig berücksichtigt werden.With the help of the data release system according to the invention, the effort required to evaluate corresponding data exchange cases can be reduced to a minimum. New data exchange cases can thus be quickly checked by experts. In order to avoid errors, it may also be necessary to first manually release a data exchange case released by the
ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDED IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of documents listed by the applicant was generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA accepts no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- US 2023/0315981 A1 [0006]US 2023/0315981 A1 [0006]
Claims (9)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102024000441.6A DE102024000441A1 (en) | 2024-02-10 | 2024-02-10 | Data sharing system and method for training artificial intelligence |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102024000441.6A DE102024000441A1 (en) | 2024-02-10 | 2024-02-10 | Data sharing system and method for training artificial intelligence |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE102024000441A1 true DE102024000441A1 (en) | 2025-01-09 |
| DE102024000441A8 DE102024000441A8 (en) | 2025-02-27 |
Family
ID=93931342
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE102024000441.6A Withdrawn DE102024000441A1 (en) | 2024-02-10 | 2024-02-10 | Data sharing system and method for training artificial intelligence |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE102024000441A1 (en) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2022133267A1 (en) | 2020-12-18 | 2022-06-23 | Paypal, Inc. | Data lifecycle discovery and management |
| US20230315981A1 (en) | 2022-03-31 | 2023-10-05 | Wipro Limited | Method and system for determining quality of a document during risk & compliance assessment |
-
2024
- 2024-02-10 DE DE102024000441.6A patent/DE102024000441A1/en not_active Withdrawn
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2022133267A1 (en) | 2020-12-18 | 2022-06-23 | Paypal, Inc. | Data lifecycle discovery and management |
| US20230315981A1 (en) | 2022-03-31 | 2023-10-05 | Wipro Limited | Method and system for determining quality of a document during risk & compliance assessment |
Also Published As
| Publication number | Publication date |
|---|---|
| DE102024000441A8 (en) | 2025-02-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE112009002000B4 (en) | Adaptive method and device for converting messages between different data formats | |
| DE202017007066U1 (en) | System and device for automatically categorizing and evaluating billing rates | |
| WO2008040664A1 (en) | Method for the computer-assisted analysis of a software source code | |
| DE102015121509A1 (en) | Methodology and device for consistency check by comparison of ontology models | |
| DE112020000004T5 (en) | Information delivery system and information delivery process | |
| DE112020003888T5 (en) | DE-IDENTIFICATION CODE FOR CROSS-ORGANIZATION TROUBLESHOOTING KNOWLEDGE | |
| DE102005046992A1 (en) | Procedure and system for risk management | |
| DE102012100392A1 (en) | Efficient source for determining inaccuracy in timed automata tracks | |
| DE102024000441A1 (en) | Data sharing system and method for training artificial intelligence | |
| DE102016114265A1 (en) | Method for at least partially machine transferring a word sequence written in a source language into a word sequence of a target language | |
| DE102024002821A1 (en) | Methods for improving the reliability of the output of a Large Language Model | |
| DE102013202376A1 (en) | Systems and methods for generating high quality formal software executable requirements | |
| EP2810191A1 (en) | Assigning measurement signal and device designations from a first classification system to a second classification system within a projection of a technical system | |
| DE102024134656B3 (en) | Method and device for generating a logic-based evaluation result | |
| DE102024000277A1 (en) | Contract management device and method for training artificial intelligence | |
| DE102016217191A1 (en) | Method for selecting and evaluating a plurality of data records from at least one data source | |
| DE102024103861A1 (en) | Method for generating software components | |
| CN115796285B (en) | Litigation case pre-judging method and device based on engineering model and electronic equipment | |
| DE102024004449A1 (en) | database system | |
| DE102024002222A1 (en) | Information technology system for assessing the compliant processing of data | |
| WO2020025119A1 (en) | Computer-implemented method for detecting document content from a document | |
| DE102025131217A1 (en) | Computer-implemented system and procedure for verifying the legitimacy of an intended use of data | |
| DE102024103183A1 (en) | Analysis system and method for controlling an analysis of at least one patent claim | |
| DE102020129099A1 (en) | Method for the computer-implemented assignment of documents intended for a certified translation | |
| CN121329300A (en) | Business analysis methods, devices, equipment, storage media, and software products |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R012 | Request for examination validly filed | ||
| R230 | Request for early publication | ||
| R120 | Application withdrawn or ip right abandoned |
