DE102024000441A1 - Data sharing system and method for training artificial intelligence - Google Patents

Data sharing system and method for training artificial intelligence Download PDF

Info

Publication number
DE102024000441A1
DE102024000441A1 DE102024000441.6A DE102024000441A DE102024000441A1 DE 102024000441 A1 DE102024000441 A1 DE 102024000441A1 DE 102024000441 A DE102024000441 A DE 102024000441A DE 102024000441 A1 DE102024000441 A1 DE 102024000441A1
Authority
DE
Germany
Prior art keywords
data
regulations
release
compliance
release case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102024000441.6A
Other languages
German (de)
Other versions
DE102024000441A8 (en
Inventor
Fabian Oliver Flohr
Mark Gerban
Michael Engel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mercedes Benz Group AG
Original Assignee
Mercedes Benz Group AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mercedes Benz Group AG filed Critical Mercedes Benz Group AG
Priority to DE102024000441.6A priority Critical patent/DE102024000441A1/en
Publication of DE102024000441A1 publication Critical patent/DE102024000441A1/en
Publication of DE102024000441A8 publication Critical patent/DE102024000441A8/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Bioethics (AREA)
  • Medical Informatics (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Technology Law (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Die Erfindung betrifft ein Datenfreigabesystem (1) zur Weitergabe von Daten an eine Drittpartei in Übereinkunft mit, eine jeweilige Weitergabe betreffenden Vorschriften, umfassend Mittel zur Verarbeitung der weiterzugebenden Daten mittels künstlicher Intelligenz. Das erfindungsgemäße Datenfreigabesystem ist gekennzeichnet durch
- eine Empfangsschnittstelle (2), dazu eingerichtet einen Freigabefall-Container zu empfangen, umfassend einen Datensatz, eine Datensatzbeschreibung und einen Datensatzkontext;
- eine Falldatenbank (3), umfassend historische Freigabefall-Container;
- ein Evaluierungsmodul (4), dazu eingerichtet den Freigabefall-Container und wenigstens einen historischen Freigabefall-Container mittels eines großen Sprachmodells (LLM) zu verarbeiten, wobei das große Sprachmodell (LLM) dazu trainiert ist eine Vorschrifteneinhaltungsbewertung zu erzeugen; und
- eine Ausgabeschnittstelle (5), dazu eingerichtet zumindest den Datensatz unter Berücksichtigung der Vorschrifteneinhaltungsbewertung an die Drittpartei weiterzugeben, wenn der Freigabefall-Container den Vorschriften zumindest bis zu einem festgelegten Erfüllungsschwellwert gerecht wird.

Figure DE102024000441A1_0000
The invention relates to a data release system (1) for forwarding data to a third party in accordance with the regulations relating to the respective forwarding, comprising means for processing the data to be forwarded using artificial intelligence. The data release system according to the invention is characterized by
- a receiving interface (2) configured to receive a release case container comprising a data record, a data record description and a data record context;
- a case database (3) comprising historical release case containers;
- an evaluation module (4) configured to process the release case container and at least one historical release case container using a large language model (LLM), the large language model (LLM) being trained to generate a compliance assessment; and
- an output interface (5) configured to forward at least the data set to the third party taking into account the compliance assessment if the release case container complies with the regulations at least up to a specified compliance threshold.
Figure DE102024000441A1_0000

Description

Die Erfindung betrifft ein Datenfreigabesystem zur Weitergabe von Daten an eine Drittpartei nach der im Oberbegriff von Anspruch 1 näher definierten Art sowie ein Verfahren zum Trainieren eines großen Sprachmodells nach der im Oberbegriff von Anspruch 8 näher definierten Art und ein Verfahren zum Trainieren eines Modells des bestärkenden Lernens nach der im Oberbegriff von Anspruch 9 näher definierten Art.The invention relates to a data release system for forwarding data to a third party according to the type defined in more detail in the preamble of claim 1 and to a method for training a large language model according to the type defined in more detail in the preamble of claim 8 and to a method for training a reinforcement learning model according to the type defined in more detail in the preamble of claim 9.

Das Geschäft eines Unternehmens kann es erfordern, Daten mit Drittparteien auszutauschen. Ein Fahrzeughersteller kann beispielsweise Betriebsdaten seiner Fahrzeuge im Feld erheben und diese in Rohform oder auch in aufbereiteter Form für eine Analyse an einen Kunden weitergeben. Beispielsweise können solche Daten das Betriebsverhalten eines Verbrennungsmotors über seine Lebensdauer beschreiben, was von einem Entwickler für Motorsteuergeräte zum Optimieren eines Programms zur Motorsteuerung verwendet werden kann.A company's business may require it to share data with third parties. For example, a vehicle manufacturer may collect operating data from its vehicles in the field and pass this on to a customer for analysis in raw or processed form. For example, such data may describe the operating behavior of an internal combustion engine over its lifetime, which can be used by an engine control unit developer to optimize an engine control program.

Die Weitergabe entsprechender Daten an Drittparteien muss mit Bedacht vollzogen werden. So dürfen keine schützenswerten Informationen nach außen gelangen. Hierzu zählen beispielsweise personenbezogene Daten oder auch Informationen, die neue technische und insbesondere unveröffentlichte Ideen betreffen. Unter Berücksichtigung verschiedener Domänen, beispielsweise unter Berücksichtigung verschiedener Märkte, Fahrzeugtypen, der Art der auszutauschenden Daten, dem Absender, dem Empfänger, dem geltenden Recht oder dergleichen, gilt es, den Umfang und die Art und Weise des Austauschs der Daten anzupassen. Den Datenaustausch betreffende Regeln werden in Form von Vorschriften ausformuliert, die es entsprechend durch alle Beteiligte einzuhalten gilt. Solche Vorschriften können neben Gesetzen auch auf firmeninternen Richtlinien basieren.The transfer of such data to third parties must be carried out with caution. No information requiring protection may be made public. This includes, for example, personal data or information relating to new technical and, in particular, unpublished ideas. Taking into account different domains, for example different markets, vehicle types, the type of data to be exchanged, the sender, the recipient, the applicable law or the like, the scope and manner of data exchange must be adapted. Rules relating to data exchange are formulated in the form of regulations that must be complied with by all parties involved. Such regulations can be based not only on laws but also on internal company guidelines.

Bevor ein solcher Datenaustausch freigegeben werden kann, muss der entsprechende Freigabefall händisch von einer Fachperson überprüft werden, um festzustellen, ob alle Vorschriften eingehalten werden. Aufgrund des zunehmenden Datenumfangs, der gegebenenfalls komplexen einzuhaltenden juristischen Randbedingungen und dem sich von Fall zu Fall stark unterscheidenden Kontext, geht dies mit einem sehr hohen manuellen Aufwand einher. Das Erteilen einer Freigabe dauert somit lange und geht mit hohen Kosten einher. Zudem macht es die Komplexität solcher Datenaustauschvorgänge zunehmend unmöglich, sämtliche hinter einer Entscheidungsfindung zur Freigabe oder Ablehnung eines entsprechenden Datenaustauschs relevanten Entscheidungslogiken nachzuvollziehen. Wird die entsprechende Überprüfung eines solchen Datenfreigabefalls nicht mit ausreichender Sorgfalt durchgeführt, so besteht das Risiko, dass sensible Daten nach Außen gelangen und/oder geltendes Recht verletzt wird. Dies muss vermieden werden.Before such a data exchange can be approved, the corresponding approval case must be checked manually by a specialist to determine whether all regulations are being complied with. Due to the increasing volume of data, the potentially complex legal framework conditions that must be complied with and the context that differs greatly from case to case, this involves a very high level of manual effort. Granting approval therefore takes a long time and is associated with high costs. In addition, the complexity of such data exchange processes makes it increasingly impossible to understand all the relevant decision-making logic behind a decision to approve or reject a corresponding data exchange. If the appropriate review of such a data release case is not carried out with sufficient care, there is a risk that sensitive data will be leaked and/or applicable law will be violated. This must be avoided.

Daher liegt der Bedarf vor, Verfahren und Mittel bereitzustellen, die es ermöglichen den Aufwand für einen Datenaustauschprozess zu reduzieren, und die dabei die Zuverlässigkeit erhöhen, dass alle relevanten Vorschriften eingehalten werden.There is therefore a need to provide procedures and means that make it possible to reduce the effort required for a data exchange process while increasing the reliability that all relevant regulations are complied with.

Aus der US 2023/0315981 A1 sind ein Verfahren und System zur Qualitätsbewertung eines Dokuments während einer Risiko- und Compliance-Bewertung bekannt. Das System bewertet dabei die Qualität eines Dokuments in Abhängigkeit von Unterschieden im Inhalt im Vergleich zu einer Vorlage. Hierzu wird der Inhalt des Dokuments zuerst unter Einsatz von Methoden der Computerlinguistik, auch als Natural Language Processing (NLP) bezeichnet, untersucht. Dies ermöglicht es, ein dokumententypspezifisches Qualitätsbewertungsmodell aus einer Datenbank auszuwählen und dieses auszuführen. Das respektive Qualitätsbewertungsmodell kann auf dem Einsatz von künstlicher Intelligenz (KI) beruhen. Als Dokumente können beispielsweise Verträge, Rechtstexte, Richtlinien, Briefe, Bedienungsanleitungen oder dergleichen bewertet werden. Diese Dokumente können insbesondere in einem Word-Format oder PDF-Format vorliegen. Es handelt sich dabei ausschließlich um Textdokumente.From the US 2023/0315981 A1 are a method and system for assessing the quality of a document during a risk and compliance assessment. The system assesses the quality of a document depending on differences in content compared to a template. To do this, the content of the document is first examined using computer linguistics methods, also known as natural language processing (NLP). This makes it possible to select a document type-specific quality assessment model from a database and execute it. The respective quality assessment model can be based on the use of artificial intelligence (AI). Documents that can be assessed include, for example, contracts, legal texts, guidelines, letters, operating instructions or the like. These documents can in particular be in Word format or PDF format. They are exclusively text documents.

Der vorliegenden Erfindung liegt die Aufgabe zugrunde ein Datenfreigabesystem anzugeben, welches es ermöglicht, Datenfreigabeprozesse unter Erhöhung der Zuverlässigkeit, dass geltende Vorschriften eingehalten werden, zu automatisieren.The present invention is based on the object of providing a data release system which makes it possible to automate data release processes while increasing the reliability that applicable regulations are complied with.

Erfindungsgemäß wird diese Aufgabe durch ein Datenfreigabesystem mit den Merkmalen des Anspruchs 1 gelöst. Vorteilhafte Ausgestaltungen und Weiterbildungen sowie ein Verfahren zum Trainieren eines großen Sprachmodells und ein Verfahren zum Trainieren eines Modells des bestärkenden Lernens ergeben sich aus den hiervon abhängigen Ansprüchen.According to the invention, this object is achieved by a data release system having the features of claim 1. Advantageous embodiments and further developments as well as a method for training a large language model and a method for training a reinforcement learning model emerge from the dependent claims.

Ein gattungsgemäßes Datenfreigabesystem zur Weitergabe von Daten an eine Drittpartei in Übereinkunft mit, eine jeweilige Weitergabe betreffenden Vorschriften, umfassend Mittel zur Verarbeitung der weiterzugebenden Daten mittels künstlicher Intelligenz, wird erfindungsgemäß weitergebildet durch

  • - eine Empfangsschnittstelle, dazu eingerichtet einen Freigabefall-Container zu empfangen, umfassend einen Datensatz, eine Datensatzbeschreibung und einen Datensatzkontext, wobei die Datensatzbeschreibung eine Beschreibung des Datensatzes und der Datensatzkontext einen Grund für die Weitergabe des Datensatzes an eine Drittpartei jeweils in computerverarbeitbarer Form umfassen;
  • - eine Falldatenbank, umfassend historische Freigabefall-Container, wobei die Empfangsschnittstelle dazu eingerichtet ist einen empfangenen Freigabefall-Container in der Falldatenbank zu speichern;
  • - ein Evaluierungsmodul, dazu eingerichtet den Freigabefall-Container und wenigstens einen historischen Freigabefall-Container mittels eines großen Sprachmodells zu verarbeiten, wobei das große Sprachmodell dazu trainiert ist durch einen Vergleich des Freigabefall-Containers mit dem wenigstens einen historischen Freigabefall-Container eine Vorschrifteneinhaltungsbewertung zu erzeugen, umfassend eine Beschreibung in welchem Ausmaß der Freigabefall-Container die die Weitergabe betreffenden Vorschriften erfüllt; und
  • - eine Ausgabeschnittstelle, dazu eingerichtet zumindest den Datensatz unter Berücksichtigung der Vorschrifteneinhaltungsbewertung an die Drittpartei weiterzugeben, wenn der Freigabefall-Container den Vorschriften zumindest bis zu einem festgelegten Erfüllungsschwellwert gerecht wird.
A generic data release system for the transfer of data to a third party in accordance with the regulations relating to the respective transfer, comprising means for processing the data to be transferred using artificial intelligence, is further developed according to the invention by
  • - a receiving interface configured to receive a release case container comprising a data record, a data record description and a data record context, wherein the data record description comprises a description of the data set and the data set context include a reason for transferring the data set to a third party, each in a computer-processable form;
  • - a case database comprising historical release case containers, wherein the receiving interface is configured to store a received release case container in the case database;
  • - an evaluation module configured to process the release case container and at least one historical release case container using a large language model, wherein the large language model is trained to generate a compliance assessment by comparing the release case container with the at least one historical release case container, comprising a description of the extent to which the release case container complies with the regulations relating to the transfer; and
  • - an output interface configured to at least forward the data set to the third party taking into account the compliance assessment if the release case container complies with the regulations at least up to a specified compliance threshold.

Das erfindungsgemäße Datenfreigabesystem ermöglicht somit eine Automatisierung des Datenfreigabe- und Weiterreichungsprozesses. Hierdurch lassen sich bisherige Arbeitsprozesse effizienter ausgestalten und somit Kosten senken. Da relevante Vorschriften automatisch auf ihre Einhaltung überprüft werden, ist es zuverlässig möglich, entsprechende Vorschrifts- bzw. Rechtsverletzungen frühzeitig zu identifizieren und damit zu vermeiden.The data release system according to the invention thus enables the automation of the data release and forwarding process. This allows existing work processes to be made more efficient and thus costs to be reduced. Since relevant regulations are automatically checked for compliance, it is reliably possible to identify corresponding violations of regulations or laws at an early stage and thus avoid them.

Das Datenfreigabesystem wird dabei von einer oder mehreren Recheneinheiten ausgebildet. Es kann sich um alle gängigen Arten von Recheneinheiten handeln, wie insbesondere einen Desktopcomputer, einen Laptop, einen Server oder Serververbund, ein System-On-A-Chip oder dergleichen. Aufgrund des hohen Rechenbedarfs von großen Sprachmodellen eignen sich Hochleistungsrechencluster hierzu besonders. Die Einzelnen logischen Module des erfindungsgemäßen Datenfreigabesystems können auch auf mehrere physische Recheneinheiten aufgeteilt sein. Das Datenfreigabesystem weist entsprechende Schnittstellen zum Empfangen und Weitergeben von Daten auf. Das Datenfreigabesystem weist einen Lesezugriff auf ein computerlesbares Speichermedium auf, auf dem wenigstens ein Computerprogrammprodukt vorgehalten wird, dessen Ausführung durch einen Prozessor des Datenfreigabesystems dieses dazu veranlasst entsprechende Verfahrensschritte auszuführen. Eine Kommunikation innerhalb des Datenfreigabesystems und/oder bevorzugt über die Empfangsschnittstelle und/oder Ausgabeschnittstelle erfolgt bevorzugt durch den Einsatz bewährter kryptografischer Verschlüsselungstechniken abgesichert.The data release system is formed by one or more computing units. These can be all common types of computing units, such as in particular a desktop computer, a laptop, a server or server network, a system-on-a-chip or the like. Due to the high computing requirements of large language models, high-performance computing clusters are particularly suitable for this. The individual logical modules of the data release system according to the invention can also be divided into several physical computing units. The data release system has corresponding interfaces for receiving and forwarding data. The data release system has read access to a computer-readable storage medium on which at least one computer program product is stored, the execution of which by a processor of the data release system causes the processor to carry out corresponding method steps. Communication within the data release system and/or preferably via the receiving interface and/or output interface is preferably secured by the use of proven cryptographic encryption techniques.

Die Empfangsschnittstelle und Ausgabeschnittstelle können dabei von ein und derselben physischen Schnittstelle ausgebildet sein. Es können alle gängigen Datenübertragungstechniken und Kommunikationsprotokolle Anwendung finden. Insbesondere erfolgt ein Datenaustausch automatisiert unter Nutzung bewährter Anwendungsprogrammierschnittstellen, auch als Application-Programming-Interface (API) bezeichnet. Über die Empfangsschnittstelle empfängt das Datenfreigabesystem einen Freigabefall-Container. Der Freigabefall-Container kann händisch von einem Nutzer zusammengestellt werden oder auch automatisiert von einem Computersystem. Der Freigabefall-Container umfasst den mit der Drittpartei auszutauschenden Datensatz sowie für jeden Datensatz eine Datensatzbeschreibung und einen Datensatzkontext. Bei der Datensatzbeschreibung und dem Datensatzkontext kann es sich um zwei separate computerlesbare Dateien handeln. Diese Dateien können jedes erdenkliche Format aufweisen und in allen gängigen Kodierungen kodiert sein. Insbesondere umfassen die Datensatzbeschreibung und der Datensatzkontext die jeweilige Beschreibung bzw. den Grund für die Weitergabe in Form eines sprachlich ausformulierten Textes. Die den Datensatz ausbildenden Informationen können ebenfalls alle erdenklichen Dateiformate annehmen. Es kann sich beispielsweise um Textdateien, eine Tabelle wie ein XML-Dokument, Sensordaten, Fotos, Videos, CAD-Daten, Simulationsdaten wie Ergebnisse einer CFD-Simulation oder einer FEM-Simulation, einen Sourcecode eines Programms oder dergleichen handeln.The receiving interface and output interface can be formed by one and the same physical interface. All common data transmission technologies and communication protocols can be used. In particular, data exchange is automated using proven application programming interfaces, also known as application programming interfaces (APIs). The data release system receives a release case container via the receiving interface. The release case container can be put together manually by a user or automatically by a computer system. The release case container contains the data set to be exchanged with the third party as well as a data set description and a data set context for each data set. The data set description and the data set context can be two separate computer-readable files. These files can have any conceivable format and be encoded in all common codings. In particular, the data set description and the data set context contain the respective description or the reason for the transfer in the form of a verbally formulated text. The information forming the data set can also take on any conceivable file format. For example, it can be text files, a table such as an XML document, sensor data, photos, videos, CAD data, simulation data such as results of a CFD simulation or a FEM simulation, a source code of a program or the like.

Die Datensatzbeschreibung beschreibt dabei insbesondere um welche Art von Daten es sich handelt, welchen Umfang diese aufweisen, in welchem Format sie vorliegen, wie viel Speicherplatz der jeweilige Datensatz beansprucht und dergleichen. Somit können die Metadaten einer computerlesbaren Datei zur Ausbildung oder Ergänzung der Datensatzbeschreibung verwendet werden. Neben dem Grund für die Weitergabe kann der Datensatzkontext auch beschreiben innerhalb welches Zielmarktes bzw. Domäne der Datenaustausch erfolgt. Ergänzende Informationen können beispielsweise beschreiben von welchem Sender der Datensatz versendet wird, im Rahmen welchen Projekts der Datenaustausch erfolgt, für welchen Empfänger der Datensatz vorgesehen ist und dergleichen. Zusammengefasst dienen die Datensatzbeschreibung und der Datensatzkontext dazu, alle für einen entsprechenden Datenaustausch relevanten Attribute zu beschreiben.The dataset description describes in particular what type of data is involved, what volume it has, what format it is in, how much storage space the respective dataset requires, and the like. The metadata of a computer-readable file can therefore be used to create or supplement the dataset description. In addition to the reason for the transfer, the dataset context can also describe within which target market or domain the data exchange takes place. Additional information can, for example, describe which sender the dataset is being sent from, within which project the data exchange takes place, which recipient the dataset is intended for, and the like. In summary, the dataset description and the dataset context serve to describe all attributes relevant to a corresponding data exchange.

In der Falldatenbank werden historische Freigabefall-Container gespeichert. Jedes Mal, wenn über die Empfangsschnittstelle ein Freigabefall-Container empfangen wird, kann dieser in der Falldatenbank ergänzt werden und somit als neuer historischer Freigabefall-Container aufgefasst werden.Historical release case containers are stored in the case database. Every time a release case container is received via the receiving interface, it can be added to the case database and thus viewed as a new historical release case container.

Das Evaluierungsmodul setzt künstliche Intelligenz in Form eines generativen, vortrainierten Transformers, auch als Generative Pretrained Transformer bezeichnet (GPT), mit einem großen Sprachmodell, auch als Large Language Model (LLM) bezeichnet, ein, um Freigabefall-Container mit historischen Freigabefall-Containern zu vergleichen. Das große Sprachmodell verarbeitet dabei den Datensatz, die Datensatzbeschreibung und den Datensatzkontext der zu vergleichenden Freigabefall-Container. Es ist dabei auch denkbar, dass das große Sprachmodell in Abhängigkeit von im Datensatz erkannter Informationen die Datensatzbeschreibung und/oder den Datensatzkontext ergänzt oder korrigiert. Das große Sprachmodell ist dabei dazu in der Lage, Bewertungsmuster in den historischen Freigabefall-Containern zu erkennen, welche das große Sprachmodell dazu in die Lage versetzen, anhand des Inhalts des Freigabefall-Containers zu klassifizieren, ob der Freigabefall-Container für den Datenaustausch freigegeben werden darf oder abgelehnt werden muss. Dabei muss das große Sprachmodell die relevanten Vorschriften selbst nicht kennen. Das Ergebnis der durch das große Sprachmodell vorgenommen Bewertung wird in Form der Vorschrifteneinhaltungsbewertung ausgegeben. Bei der Vorschrifteneinhaltungsbewertung handelt es sich ebenfalls um eine computerverarbeitbare Information, insbesondere in Form einer separaten computerlesbaren Datei. Diese Datei kann ebenfalls in beliebigen geeigneten Dateiformaten vorliegen. Insbesondere umfasst die Vorschrifteneinhaltungsbewertung eine Zusammenfassung der Bewertung des Freigabefall-Containers durch das große Sprachmodell in Form eines menschenlesbaren Textes. Basierend auf der Vorschrifteneinhaltungsbewertung kann zudem eine Risikobewertung vorgenommen werden und ein sogenanntes Audit-Log erzeugt werden, welche den Freigabefallbewertungsprozess durch das Evaluierungsmodul zusammenfasst. Eine Vorschrifteneinhaltungsbewertung kann in einen Freigabefall-Container hinzugefügt werden.The evaluation module uses artificial intelligence in the form of a generative, pre-trained transformer (GPT) with a large language model (LLM) to compare release case containers with historical release case containers. The large language model processes the data set, the data set description and the data set context of the release case containers to be compared. It is also conceivable that the large language model supplements or corrects the data set description and/or the data set context depending on information recognized in the data set. The large language model is able to recognize evaluation patterns in the historical release case containers, which enable the large language model to classify, based on the content of the release case container, whether the release case container may be released for data exchange or must be rejected. The large language model does not have to know the relevant regulations itself. The result of the assessment performed by the large language model is output in the form of the compliance assessment. The compliance assessment is also computer-processable information, in particular in the form of a separate computer-readable file. This file can also be in any suitable file format. In particular, the compliance assessment includes a summary of the assessment of the release case container by the large language model in the form of a human-readable text. Based on the compliance assessment, a risk assessment can also be performed and a so-called audit log can be generated, which summarizes the release case assessment process by the evaluation module. A compliance assessment can be added to a release case container.

Das Datenfreigabesystem ist dazu in der Lage, durch das Evaluierungsmodul bewertete Freigabefall-Container in Abhängigkeit des Ausmaßes, wie sehr die geltenden Vorschriften eingehalten werden, automatisch an relevante Drittparteien weiterzuleiten. Hierzu kann das Evaluierungsmodul das Ausmaß beispielsweise in Form einer Prozentangabe oder einer Zahl innerhalb eines festgelegten Wertebereichs definieren. Anschließend vergleicht das Datenfreigabesystem dieses Ausmaß mit dem festgelegten Erfüllungsschwellwert. Übersteigt das Ausmaß den Erfüllungsschwellwert, so kann der Freigabefall-Container bzw. zumindest der im Freigabefall-Container enthaltende Datensatz an die Drittpartei weitervermittelt werden. Beispielsweise können entsprechende Daten über das Internet übertragen werden. Der Erfüllungsschwellwert kann individuell für verschiedene Freigabefälle angepasst werden. Dies kann ebenfalls automatisch durch ein Computersystem erfolgen oder aber per Hand durch einen Nutzer.The data release system is able to automatically forward release case containers evaluated by the evaluation module to relevant third parties depending on the extent to which the applicable regulations are complied with. To do this, the evaluation module can define the extent, for example, in the form of a percentage or a number within a specified range of values. The data release system then compares this extent with the specified compliance threshold. If the extent exceeds the compliance threshold, the release case container or at least the data set contained in the release case container can be forwarded to the third party. For example, corresponding data can be transmitted over the Internet. The compliance threshold can be individually adjusted for different release cases. This can also be done automatically by a computer system or manually by a user.

Eine vorteilhafte Weiterbildung des erfindungsgemäßen Datenfreigabesystems zeichnet sich aus durch:

  • - eine Überprüfungsschnittstelle, dazu eingerichtet den Freigabefall-Container und die Vorschrifteneinhaltungsbewertung an einen Nutzer auszugeben und eine Vorschrifteneinhaltungsaussage von dem Nutzer zu empfangen, wobei die Vorschrifteneinhaltungsaussage eine durch den Nutzer bestätigte, abgelehnte oder korrigierte Vorschrifteneinhaltungsbewertung umfasst; und
  • - ein Lernmodul, dazu eingerichtet die Vorschrifteneihaltungsaussage in den Freigabefall-Container zu inkludieren und durch den Einsatz eines Modells des bestärkenden Lernens in Abhängigkeit des Inhalts der Vorschrifteneinhaltungsaussage eine Eingabeaufforderung für das große Sprachmodell zu formulieren und diese an das Evaluierungsmodul für die nächste Evaluierung eines Freigabefall-Containers zu übermitteln.
An advantageous development of the data release system according to the invention is characterized by:
  • - a verification interface configured to issue the release case container and the compliance assessment to a user and to receive a compliance statement from the user, the compliance statement comprising a compliance assessment confirmed, rejected or corrected by the user; and
  • - a learning module designed to include the compliance statement in the release case container and, by using a reinforcement learning model, to formulate a prompt for the large language model depending on the content of the compliance statement and to transmit this to the evaluation module for the next evaluation of a release case container.

Es ist davon auszugehen, dass das große Sprachmodell, insbesondere wenn es erstmalig seine Arbeit aufnimmt, Fehler bei der Bewertung entsprechender Freigabefall-Container macht. Durch das Vorsehen der Überprüfungsschnittstelle und des Lernmoduls ist es möglich, einen Lernprozess in Gang zu setzen, um die Zuverlässigkeit zu erhöhen, dass das große Sprachmodell jeweilige Freigabefall-Container zuverlässiger bewertet.It can be assumed that the large language model, especially when it first starts working, will make errors when evaluating corresponding release case containers. By providing the verification interface and the learning module, it is possible to initiate a learning process in order to increase the reliability that the large language model evaluates respective release case containers more reliably.

Die Überprüfungsschnittstelle kann analog zur Empfangsschnittstelle und/oder Ausgabeschnittstelle ausgeführt sein. Bei dem Nutzer handelt es sich insbesondere um eine mit den geltenden Vorschriften betraute bzw. fachkundige Person wie einen Juristen. Der Nutzer ist dazu in der Lage, die Bewertung des Freigabefall-Containers durch das große Sprachmodell zu überprüfen und somit die Vorschrifteneinhaltungsbewertung entsprechend zu bestätigen, abzulehnen oder zu korrigieren. Als Ergebnis stellt der Nutzer die Vorschrifteneinhaltungsaussage bereit. Im einfachsten Falle handelt es sich dabei um die Vorschrifteneinhaltungsbewertung, welche durch eine entsprechende Analyseinformation durch den Nutzer ergänzt wird. Diese Analyseinformation kann in Form eines Markers aufgefasst werden, der beschreibt, ob die Vorschrifteneinhaltungsbewertung bestätigt, abgelehnt oder korrigiert wurde. Korrekturen können dabei insbesondere hervorgehoben werden. Besonders bevorzugt umfasst die Vorschrifteneinhaltungsaussage auch eine Erklärung dafür, warum und wie der Nutzer die Vorschrifteneinhaltungsbewertung entsprechend bestätigt, abgelehnt oder korrigiert hat.The verification interface can be designed analogously to the receiving interface and/or output interface. The user is in particular a person who is entrusted with the applicable regulations or is an expert, such as a lawyer. The user is able to check the assessment of the release case container by the large language model and thus confirm, reject or correct the compliance assessment accordingly. As a result, the user provides the compliance statement. In the simplest case, this is the compliance assessment, which is carried out by an appropriate analysis in information is supplemented by the user. This analysis information can be understood in the form of a marker that describes whether the compliance assessment was confirmed, rejected or corrected. Corrections can be highlighted in particular. It is particularly preferred that the compliance statement also includes an explanation of why and how the user confirmed, rejected or corrected the compliance assessment accordingly.

Das Lernmodul verarbeitet die Vorschrifteneinhaltungsaussage und ist durch ein entsprechend trainiertes Modell des bestärkenden Lernens dazu fähig, in Abhängigkeit des Inhalts der Vorschrifteneinhaltungsaussage entsprechende Eingabeaufforderungen für das große Sprachmodell anzupassen. Eine Eingabeaufforderung wird auch als Prompt bezeichnet. Über ein solches Prompt lässt sich die Arbeitsweise eines großen Sprachmodells gezielt beeinflussen.The learning module processes the compliance statement and, thanks to a suitably trained reinforcement learning model, is able to adapt appropriate input prompts for the large language model depending on the content of the compliance statement. An input prompt is also known as a prompt. Such a prompt can be used to specifically influence the way a large language model works.

Bevorzugt ist dabei das Evaluierungsmodul dazu eingerichtet die Vorschrifteneinhaltungsbewertung für einen Freigabefall-Container unter Berücksichtigung einer vom Lernmodul formulierten Eingabeaufforderung und/oder einer in den Freigabefall-Container oder einen historischen Freigabefall-Container inkludierten Vorschrifteneinhaltungsaussage zu erzeugen. Das große Sprachmodell kann hierdurch die Zuverlässigkeit einer korrekten Bewertung des aktuell zu klassifizierenden Freigabefall-Containers erhöhen. Dabei handelt es sich um einen iterativen Prozess, wobei mit jeder Iteration die Klassifizierungsfähigkeit des großen Sprachmodells erhöht wird. Das große Sprachmodell ist dabei selbst dazu in der Lage, die vom Nutzer generierte Vorschrifteneinhaltungsaussage zu verarbeiten und somit Muster zu identifizieren, welche zu Abweichungen zwischen der Vorschrifteneinhaltungsbewertung und der Vorschrifteneinhaltungsaussage führen. Dies versetzt das große Sprachmodell dazu in die Lage, Freigabefall-Container wie der Nutzer zu klassifizieren. Von Iteration zu Iteration steigt die Anzahl verwerteter Vorschrifteneinhaltungsaussagen, sodass die Bewertungsgüte des großen Sprachmodells mit der Zeit immer besser wird.Preferably, the evaluation module is set up to generate the compliance assessment for a release case container taking into account an input prompt formulated by the learning module and/or a compliance statement included in the release case container or a historical release case container. The large language model can thereby increase the reliability of a correct assessment of the release case container currently to be classified. This is an iterative process, with each iteration increasing the classification ability of the large language model. The large language model itself is able to process the compliance statement generated by the user and thus identify patterns that lead to deviations between the compliance assessment and the compliance statement. This enables the large language model to classify release case containers like the user. From iteration to iteration, the number of compliance statements evaluated increases, so that the evaluation quality of the large language model improves over time.

Eine weitere vorteilhafte Ausgestaltung des erfindungsgemäßen Datenfreigabesystems sieht ferner vor, dass das Evaluierungsmodul dazu eingerichtet ist, mittels des großen Sprachmodells im Zuge der Erzeugung der Vorschrifteneinhaltungsbewertung eine Referenzinformation zu erzeugen, umfassend wenigstens eine Referenz zu einem historischen Freigabefall-Container, auf dessen Ausmaß des Erfüllens der Vorschriften basierend, das große Sprachmodell die Vorschrifteneinhaltungsbewertung für den Freigabefall-Container erzeugt. Mit anderen Worten kann das Evaluierungsmodul einem Nutzer somit einen Hinweis auf relevante vormalige Datenfreigabefälle präsentieren, auf deren Bewertung die Klassifizierung des aktuell betrachteten Freigabefall-Containers beruht. Entsprechend referenzierte historische Freigabefall-Container weisen somit Ähnlichkeiten im Datensatz, der Datensatzbeschreibung und/oder den Datensatzkontext auf.A further advantageous embodiment of the data release system according to the invention further provides that the evaluation module is set up to generate reference information using the large language model in the course of generating the regulatory compliance assessment, comprising at least one reference to a historical release case container, based on the extent to which the regulations are met, the large language model generates the regulatory compliance assessment for the release case container. In other words, the evaluation module can thus present a user with a reference to relevant previous data release cases, on the assessment of which the classification of the currently considered release case container is based. Correspondingly referenced historical release case containers thus have similarities in the data set, the data set description and/or the data set context.

Entsprechend einer weiteren vorteilhaften Ausgestaltung des erfindungsgemäßen Datenfreigabesystems weist dieses eine Vorschriftendatenbank auf, umfassend die Weitergabe von Daten betreffende Vorschriften, wobei die Vorschriftendatenbank dazu eingerichtet ist neue Vorschriften aufzunehmen und/oder eine bereits gespeicherte Vorschrift durch eine aktualisierte Vorschrift anzupassen, und wobei das Evaluierungsmodul dazu eingerichtet ist die Vorschrifteneinhaltungsbewertung für einen Freigabefall-Container unter Berücksichtigung der in der Vorschriftendatenbank vorgehaltenen Vorschriften zu erzeugen. Somit ist es nicht nur möglich, die Bewertung eines jeweiligen Freigabefall-Containers alleinig basierend auf den durch den Vergleich des Freigabefall-Containers mit historischen Freigabefall-Containern identifizierten Mustern zu klassifizieren, sondern das große Sprachmodell kann auch die jeweiligen relevanten Vorschriften direkt auslesen und berücksichtigen. Die Vorschriften können dabei in Form von natürlicher Sprache ausformuliert sein. Aufgrund seiner Fähigkeiten in Sprache ausformulierte Texte zu verarbeiten und „zu verstehen“, kann das große Sprachmodell somit noch zuverlässiger prüfen, ob jeweilige Freigabefall-Container tatsächlich den aktuell gelten Vorschriften gerecht werden oder nicht.According to a further advantageous embodiment of the data release system according to the invention, it has a regulations database, comprising regulations relating to the transfer of data, wherein the regulations database is set up to include new regulations and/or to adapt an already stored regulation with an updated regulation, and wherein the evaluation module is set up to generate the regulatory compliance assessment for a release case container taking into account the regulations held in the regulations database. Thus, it is not only possible to classify the assessment of a respective release case container based solely on the patterns identified by comparing the release case container with historical release case containers, but the large language model can also directly read out and take into account the respective relevant regulations. The regulations can be formulated in the form of natural language. Due to its ability to process and "understand" texts formulated in language, the large language model can thus check even more reliably whether respective release case containers actually comply with the currently applicable regulations or not.

Entsprechend kann die Vorschrifteneinhaltungsbewertung nicht nur eine Prozentangabe oder eine Zahl aus einem festgelegten Wertebereich umfassen, um das Ausmaß zu beschreiben, wie sehr die jeweiligen Vorschriften eingehalten werden, sondern das Evaluierungsmodul kann einen direkten Bezug zwischen dem aktuellen Freigabefall-Container und den Vorschriften herstellen. Beispielsweise kann die Vorschrifteneinhaltungsbewertung für einige oder alle zu berücksichtigende Vorschriften eine textuelle Erläuterung umfassen, wieso und in welchem Ausmaß genau diese Vorschrift eingehalten wird oder nicht. Die textuelle Erläuterung kann auch durch Grafiken oder Diagramme angereichert sein.Accordingly, the compliance assessment can not only include a percentage or a number from a specified range of values to describe the extent to which the respective regulations are complied with, but the evaluation module can establish a direct link between the current release case container and the regulations. For example, the compliance assessment can include a textual explanation for some or all of the regulations to be considered, why and to what extent exactly this regulation is complied with or not. The textual explanation can also be enriched with graphics or diagrams.

Die Vorschriftendatenbank kann aktualisierbar sein. So können neue Vorschriften ergänzt werden und/oder alte Vorschriften aktualisiert werden. Durch eine direkte Berücksichtigung der Vorschriften wird die Zuverlässigkeit noch weiter erhöht, dass das große Sprachmodell jeweilige Freigabefall-Container korrekt bewertet.The regulations database can be updated. This means that new regulations can be added and/or old regulations updated. By directly taking the regulations into account, the reliability that the large language model correctly evaluates the respective release case containers is increased even further.

Eine weitere vorteilhafte Ausgestaltung des erfindungsgemäßen Datenfreigabesystems sieht ferner vor, dass das Evaluierungsmodul dazu eingerichtet ist einen historischen Freigabefall-Container durch das Erzeugen der Vorschrifteneinhaltungsbewertung unter Berücksichtigung neuer und/oder ergänzter Vorschriften und/oder eines geänderten Inhalts des respektiven historischen Freigabefall-Containers neu zu bewerten. Ändern sich die Vorschriften und/oder der Inhalt eines historischen Freigabefall-Containers, kann dies eine Neubewertung eines älteren Datenaustauschfalls erfordern. Das Datenfreigabesystem ist erfindungsgemäß dazu in der Lage, historische Freigabefall-Container, also vormalige Datenaustauschprozesse, neu zu bewerten. So können Maßnahmen eingeleitet werden, sollten in einem vormaligen Datenaustauschfall entsprechende Vorschriften nun nicht mehr eingehalten werden. Ein solcher Datenaustauschfall kann beispielsweise das regelmäßige Übermitteln neu anfallender Daten an eine entsprechende Drittpartei vorsehen. Entsprechend kann der nächste Datenübertragungszyklus an die Drittpartei pausiert, gestoppt werden oder angepasst werden.A further advantageous embodiment of the data release system according to the invention further provides that the evaluation module is set up to re-evaluate a historical release case container by generating the compliance assessment taking into account new and/or supplemented regulations and/or a changed content of the respective historical release case container. If the regulations and/or the content of a historical release case container change, this may require a re-evaluation of an older data exchange case. According to the invention, the data release system is able to re-evaluate historical release case containers, i.e. previous data exchange processes. In this way, measures can be initiated if corresponding regulations are no longer complied with in a previous data exchange case. Such a data exchange case can, for example, provide for the regular transmission of newly generated data to a corresponding third party. The next data transmission cycle to the third party can be paused, stopped or adjusted accordingly.

Das Datenfreigabesystem kann ein Skript ausführen, welches in Abhängigkeit geänderter Vorschriften und/oder eines geänderten Inhalts des historischen Freigabefall-Containers relevante Datenaustauschfälle auffindet.The data release system can execute a script that finds relevant data exchange cases depending on changed regulations and/or a changed content of the historical release case container.

Entsprechend einer weiteren vorteilhaften Ausgestaltung des erfindungsgemäßen Datenfreigabesystems ist das Evaluierungsmodul dazu eingerichtet, Vorschriften in Abhängigkeit von durch die Verarbeitung eines Freigabefall-Containers und/oder eines historischen Freigabefall-Containers identifizierte Bewertungsmuster zu formulieren, selbst formulierte Vorschriften mit den in der Vorschriftendatenbank vorgehaltenen Vorschriften abzugleichen und eine selbst formulierte Vorschrift in der Vorschriftendatenbank zu ergänzen, wenn die selbst formulierte Vorschrift über ein festgelegtes Maß von sämtlichen bisher in der Vorschriftendatenbank vorgehaltenen Vorschriften abweicht. Wie bereits erwähnt, ist das große Sprachmodell dazu in der Lage, Freigabefall-Container allein durch den Vergleich mit historischen Freigabefall-Containern zu bewerten. Dies wird durch das Identifizieren entsprechender Bewertungsmuster ermöglicht. Diese Bewertungsmuster können vom großen Sprachmodell zu neuen Vorschriften ausformuliert werden und diese in der Vorschriftendatenbank ergänzt werden. Auch ist es denkbar, bestehende Vorschriften durch das große Sprachmodell zu überarbeiten. Dies ermöglicht es einem Betreiber des Datenfreigabesystems zuverlässig und mit geringem Aufwand relevante Vorschriften, über die der Betreiber noch nicht ausreichend gewahr ist, transparent aufzudecken und in die Vorschriftendatenbank aufzunehmen. Eine Aufnahme solcher selbst formulierten Vorschriften in die Vorschriftendatenbank erfolgt bevorzugt nur dann, wenn sich die jeweiligen selbst formulierten Vorschriften fundamental von bereits bekannten Vorschriften unterscheiden, und nicht nur durch Kleinigkeiten wie Schreibfehler, eine abweichende Grammatik oder dergleichen.According to a further advantageous embodiment of the data release system according to the invention, the evaluation module is set up to formulate regulations depending on evaluation patterns identified by processing a release case container and/or a historical release case container, to compare self-formulated regulations with the regulations held in the regulations database and to supplement a self-formulated regulation in the regulations database if the self-formulated regulation deviates by a specified amount from all regulations previously held in the regulations database. As already mentioned, the large language model is able to evaluate release case containers solely by comparing them with historical release case containers. This is made possible by identifying corresponding evaluation patterns. These evaluation patterns can be formulated into new regulations by the large language model and these can be supplemented in the regulations database. It is also conceivable to revise existing regulations using the large language model. This enables an operator of the data release system to reliably and with little effort transparently uncover relevant regulations of which the operator is not yet sufficiently aware and to include them in the regulations database. Such self-formulated regulations are preferably only included in the regulations database if the respective self-formulated regulations differ fundamentally from already known regulations, and not just due to minor details such as spelling mistakes, different grammar or the like.

Bei einem Verfahren zum Trainieren eines von einem Evaluierungsmodul eines im vorigen beschriebenen Datenfreigabesystems einsetzbaren großen Sprachmodells ist es erfindungsgemäß vorgesehen, dass das große Sprachmodell die selbst erzeugte Vorschrifteneinhaltungsbewertung und die vom Nutzer erzeugte Vorschrifteneinhaltungsaussage für denselben Freigabefall-Container einliest, wobei das große Sprachmodell die Vorschrifteneinhaltungsaussage als Grundwahrheit betrachtet. Dies ermöglicht ein fortwährendes Training des großen Sprachmodells. So vergleicht das große Sprachmodell die selbst erzeugte Vorschrifteneinhaltungsbewertung mit der Vorschrifteneinhaltungsaussage und ist somit dazu in der Lage nachzuvollziehen, welche Aspekte einer Überprüfung, ob jeweilige Freigabefall-Container die geltenden Vorschriften erfüllen oder nicht, korrekt angewendet wurden und welche nicht. Das große Sprachmodell kann somit sein Vorgehen zum Bewerten bzw. Klassifizieren von Freigabefall-Container optimieren.In a method for training a large language model that can be used by an evaluation module of a data release system described above, the invention provides that the large language model reads in the self-generated compliance assessment and the user-generated compliance statement for the same release case container, with the large language model considering the compliance statement as the ground truth. This enables continuous training of the large language model. The large language model compares the self-generated compliance assessment with the compliance statement and is thus able to understand which aspects of a check as to whether respective release case containers comply with the applicable regulations or not were applied correctly and which were not. The large language model can thus optimize its procedure for evaluating or classifying release case containers.

Ein Verfahren zum Trainieren eines von einem Lernmodul eines im vorigen beschriebenen Datenfreigabesystems einsetzbaren Modells des bestärkenden Lernens weist erfindungsgemäß die folgenden Verfahrensschritte auf:

  • - Einlesen der vom Nutzer erzeugten Vorschrifteneinhaltungsaussage in das Modell des bestärkenden Lernens;
  • - Abändern der für das große Sprachmodell formulierten Eingabeaufforderung, wenn die Vorschrifteneinhaltungsaussage eine Änderung oder eine Ablehnung der vom großen Sprachmodell erzeugten Vorschrifteneinhaltungsbewertung umfasst; und
  • - erneutes Durchführen der beiden vorigen Verfahrensschritte solange, bis die Vorschrifteneinhaltungsaussage eine Bestätigung der Vorschrifteneinhaltungsbewertung umfasst.
A method for training a reinforcement learning model that can be used by a learning module of a data release system described above comprises the following method steps:
  • - Reading the user-generated compliance statement into the reinforcement learning model;
  • - modifying the prompt formulated for the large language model if the compliance statement involves a change or rejection of the compliance assessment generated by the large language model; and
  • - repeating the two previous steps until the compliance statement includes a confirmation of the compliance assessment.

Somit kann nicht nur das große Sprachmodell selbst weitertrainiert werden, sondern die Funktionsweise des großen Sprachmodells mit Hilfe des Modells des bestärkenden Lernens nach und nach angepasst werden. Durch das Training wird das Modell des bestärkenden Lernens dabei gezielt dazu in die Lage versetzt, immer zutreffendere Eingabeaufforderungen für das große Sprachmodell auszuformulieren.This means that not only can the large language model itself be further trained, but the way the large language model works can also be gradually adapted with the help of the reinforcement learning model. Through training, the reinforcement learning model is specifically enabled to formulate increasingly accurate input prompts for the large language model.

Weitere vorteilhafte Ausgestaltungen des erfindungsgemäßen Datenfreigabesystems sowie des Verfahrens zum Trainieren des großen Sprachmodells und des Modells des bestärkenden Lernens ergeben sich auch aus den Ausführungsbeispielen, welche nachfolgend unter Bezugnahme auf die Figuren näher beschrieben werden.Further advantageous embodiments of the data release system according to the invention and of the method for training the large language model and the reinforcement learning model also emerge from the embodiments which are described in more detail below with reference to the figures.

Dabei zeigen:

  • 1 eine schematische Darstellung des von einem erfindungsgemäßen Datenfreigabesystems ausgeführten Verfahrensablaufs; und
  • 2 eine schematische Darstellung des erfindungsgemäßen Datenfreigabesystems.
The following show:
  • 1 a schematic representation of the process sequence carried out by a data release system according to the invention; and
  • 2 a schematic representation of the data release system according to the invention.

Das Weiterreichen von firmeninternen Daten an eine externe Stelle unterliegt bestimmten Vorschriften. Mit Hilfe eines in 2 gezeigten Datenfreigabesystems 1 lässt sich die Weitergabe solcher Daten an Drittparteien automatisieren und zuverlässig das Einhalten von Vorschriften gewährleisten. 1 veranschaulicht dabei den vom Datenfreigabesystem 1 ausgeführten Verfahrensablauf.The forwarding of internal company data to an external party is subject to certain regulations. With the help of a 2 The data sharing system 1 shown can automate the sharing of such data with third parties and reliably ensure compliance with regulations. 1 illustrates the procedure carried out by the data release system 1.

Zuerst wird ein Freigabefall-Container erzeugt, umfassend einen an eine Drittpartei weiterzureichenden Datensatz sowie eine Datensatzbeschreibung und einen Datensatzkontext. Der Freigabefall-Container wird dem Datenfreigabesystem 1 in Schritt 101 zugeführt.First, a release case container is created, comprising a data set to be passed on to a third party, as well as a data set description and a data set context. The release case container is fed to the data release system 1 in step 101.

Der Freigabefall-Container wird in einem Schritt 102 in einer Falldatenbank 3 gespeichert. In der Falldatenbank 3 sind vormalige Freigabefall-Container, in diesem Kontext als historische Freigabefall-Container bezeichnet, gespeichert.The release case container is stored in a case database 3 in a step 102. Previous release case containers, referred to in this context as historical release case containers, are stored in the case database 3.

Historische Freigabefall-Container weisen bereits eine Bewertung auf, inwieweit jeweilige Vorschriften eingehalten werden. Diese Beschreibung kann durch eine Erklärung angereichert sein, beschreibend wieso die entsprechende Bewertung in diesem Ausmaß erfolgte.Historical release case containers already contain an assessment of the extent to which the respective regulations are complied with. This description can be supplemented by an explanation describing why the corresponding assessment was made to this extent.

In einem Schritt 103 erfolgt eine Bewertung des Freigabefall-Containers mittels eines von einem Evaluierungsmodul 4 ausgeführten großen Sprachmodells LLM. Das große Sprachmodell LLM ist dazu in der Lage durch Analyse historischer Freigabefall-Container entsprechende Bewertungsmuster zu identifizieren und diese auf den aktuellen Freigabefall-Container anzuwenden. Das Ergebnis des großen Sprachmodells LLM wird in Form einer Vorschrifteneinhaltungsbewertung zusammengefasst.In a step 103, the release case container is evaluated using a large language model LLM executed by an evaluation module 4. The large language model LLM is able to identify appropriate evaluation patterns by analyzing historical release case containers and to apply these to the current release case container. The result of the large language model LLM is summarized in the form of a regulatory compliance assessment.

Das große Sprachmodell LLM kann dabei in einem Schritt 104 eine Referenzinformation erzeugen, die auf für den aktuellen Freigabefall-Container relevante historische Freigabefall-Container verweist. Dabei werden solche historischen Freigabefall-Container referenziert, deren Bewertungsschema für den aktuellen Freigabefall-Container angewendet wurde. Dies erlaubt es einem Betreiber des Datenfreigabesystems 1 schnell und einfach die Bewertungsweise des großen Sprachmodell LLM nachzuvollziehen sowie vormalige Datenaustauchfälle erneut zu überprüfen.In a step 104, the large language model LLM can generate reference information that refers to historical release case containers relevant to the current release case container. In doing so, reference is made to those historical release case containers whose evaluation scheme was applied to the current release case container. This allows an operator of the data release system 1 to quickly and easily understand the evaluation method of the large language model LLM and to re-examine previous data exchange cases.

In einem Schritt 105 kann eine Überprüfung des Bewertungsergebnisses des großen Sprachmodells LLM durch einen Nutzer 7 erfolgen. Bei dem Nutzer 7 handelt es sich insbesondere um eine mit den Vorschriften vertraute Person wie einen Juristen. So analysiert der Nutzer 7 die Vorschrifteneinhaltungsbewertung und reichert diese durch eine Information an. Diese Information beschreibt, ob die Vorschrifteneinhaltungsbewertung abgelehnt, bestätigt oder korrigiert wurde, insbesondere in welchem Umfang. Hierdurch wird eine Vorschrifteneinhaltungsaussage 11 generiert.In a step 105, the evaluation result of the large language model LLM can be checked by a user 7. The user 7 is in particular a person familiar with the regulations, such as a lawyer. The user 7 thus analyses the regulatory compliance assessment and enriches it with information. This information describes whether the regulatory compliance assessment was rejected, confirmed or corrected, in particular to what extent. This generates a regulatory compliance statement 11.

Die Vorschrifteneinhaltungsaussage 11 kann dem großen Sprachmodell LLM für ein beständiges Weitertrainieren zugeführt werden. Auch kann ein Modell des bestärkenden Lernens REM vorgesehen sein, welches zum Anpassen der Eingabeaufforderung für das große Sprachmodell LLM dient. Die Abkürzung REM steht dabei für Reinforcement-Learning-Model.The compliance statement 11 can be fed into the large language model LLM for continuous training. A reinforcement learning model REM can also be provided, which is used to adapt the input prompt for the large language model LLM. The abbreviation REM stands for reinforcement learning model.

Das große Sprachmodell LLM kann in Schritt 106 die selbst identifizierten Bewertungsmuster in Form von neuen Vorschriften ausformulieren und diese in einer Vorschriftendatenbank 9 ergänzen. Auch kann das große Sprachmodell LLM bestehende Vorschriften überarbeiten.In step 106, the large language model LLM can formulate the self-identified evaluation patterns in the form of new regulations and supplement these in a regulations database 9. The large language model LLM can also revise existing regulations.

In Schritt 107 wird eine finale Bewertung des Freigabefall-Containers erhalten. Neben dem Erfüllungsgrad der relevanten Vorschriften kann diese Information auch eine Risikobewertung und/oder ein sogenanntes Audit-Log umfassen. In Schritt 108 ist die Freigabewertung des Freigabefall-Containers abgeschlossen und der jeweilige Freigabefall-Container kann gegebenenfalls, sollte er die relevanten Vorschriften ausreichend erfüllen, automatisch an eine besagte Drittpartei weitervermittelt werden. Gegebenenfalls muss dies erst manuell bestätigt werden.In step 107, a final assessment of the release case container is obtained. In addition to the degree of compliance with the relevant regulations, this information can also include a risk assessment and/or a so-called audit log. In step 108, the release assessment of the release case container is completed and the respective release case container can, if it sufficiently complies with the relevant regulations, be automatically forwarded to a third party. If necessary, this must first be confirmed manually.

2 verdeutlicht den Aufbau des erfindungsgemäßen Datenfreigabesystems 1. Das Datenfreigabesystem 1 umfasst eine Empfangsschnittstelle 2, ein das große Sprachmodell LLM ausführendes bzw. bereitstellendes Evaluierungsmodul 4, ein Lernmodul 8 zur Ausführung bzw. Bereitstellung des Modells des bestärkenden Lernens REM sowie die besagte Falldatenbank 3 und Vorschriftendatenbank 9. Ferner umfasst das Datenfreigabesystem 1 eine Ausgabeschnittstelle 5 zur Ausgabe entsprechender Bewertungsergebnisse an einen Betreiber des Datenfreigabesystems 1 sowie zum Weiterreichen von Freigabefall-Containern an Drittparteien. Bei dem in 2 gezeigten bevorzugten Ausführungsbeispiel sind die Empfangsschnittstelle 2 und die Ausgabeschnittstelle 5 in eine gemeinsame logische Einheit integriert. Die Empfangsschnittstelle 2 und die Ausgabeschnittstelle 5 können auch als Service- und Ticketingsystem bezeichnet werden. Hierbei kann es sich beispielsweise um einen Webservice handeln, welcher eine Nutzerinteraktion mit dem Datenfreigabesystem 1 erlaubt. So kann eine Person über die Empfangsschnittstelle 2 eine Anfrage 10 zur Freigabe eines Datenaustauschs mit einer Drittpartei übermitteln. Auch ist es denkbar, dass die Ausgabeschnittstelle 5 andersartig ausgestaltet ist, sodass entsprechende durch das Datenfreigabesystem 1 freigegebene Freigabefall-Container auf einem anderen Wege als unter Nutzung eines entsprechenden Service- und Ticketingsystems an Drittparteien bereitgestellt werden können (nicht dargestellt). 2 clarifies the structure of the data release system 1 according to the invention. The data release system 1 comprises a receiving interface 2, an evaluation module 4 executing or providing the large language model LLM, a learning module 8 for executing or providing the reinforcement learning model REM as well as the aforementioned case database 3 and regulations database 9. The data release system also comprises tem 1 an output interface 5 for outputting corresponding evaluation results to an operator of the data release system 1 and for forwarding release case containers to third parties. 2 In the preferred embodiment shown, the receiving interface 2 and the output interface 5 are integrated into a common logical unit. The receiving interface 2 and the output interface 5 can also be referred to as a service and ticketing system. This can be, for example, a web service that allows user interaction with the data release system 1. For example, a person can transmit a request 10 to release a data exchange with a third party via the receiving interface 2. It is also conceivable that the output interface 5 is designed differently, so that corresponding release case containers released by the data release system 1 can be made available to third parties in a way other than using a corresponding service and ticketing system (not shown).

Über die Empfangsschnittstelle 2 empfangene Freigabefall-Container werden nun dem Evaluierungsmodul 4 zugeführt und durch das große Sprachmodell LLM bewertet. Diese Bewertung in Form der Vorschrifteneinhaltungsbewertung kann dann dem Nutzer 7 sowie dem Lernmodul 8 zugeführt werden. Der Nutzer 7 kontrolliert und korrigiert gegebenenfalls die Bewertung des großen Sprachmodells LLM. Diese Bewertung liegt in Form einer Vorschrifteneinhaltungsaussage 11 vor. Informationen werden dabei dem Nutzer 7 über eine Überprüfungsschnittstelle 6 zugespielt bzw. von diesem Empfangen. Die Überprüfungsschnittstelle 6 könnte ebenfalls in das Service- und Ticketingsystem integriert sein.Release case containers received via the receiving interface 2 are now fed to the evaluation module 4 and evaluated by the large language model LLM. This evaluation in the form of the compliance assessment can then be fed to the user 7 and the learning module 8. The user 7 checks and corrects the assessment of the large language model LLM if necessary. This assessment is available in the form of a compliance statement 11. Information is fed to the user 7 via a verification interface 6 or received from the user. The verification interface 6 could also be integrated into the service and ticketing system.

Die Vorschrifteneinhaltungsaussage 11 kann dem Lernmodul 8 zum Weitertrainieren des Modells des bestärkenden Lernens REM zugeführt werden. Das Modell des bestärkenden Lernens REM formuliert dann neue Eingabeaufforderungen für das große Sprachmodell LLM.The compliance statement 11 can be fed to the learning module 8 to further train the reinforcement learning model REM. The reinforcement learning model REM then formulates new prompts for the large language model LLM.

Das große Sprachmodell LLM kann auf die Vorschriftendatenbank 9 zugreifen, um jeweilige Vorschriften zu beziehen und zur Erzeugung der Vorschrifteneinhaltungsbewertung zu berücksichtigen. Selbst neu generierte Vorschriften können in der Vorschriftendatenbank 9 ergänzt werden. Das Datenfreigabesystem 1 kann ein Skript 12 ausführen, welches die Aufnahme neuer Vorschriften in die Vorschriftendatenbank 9 erkennt und durch einen Vergleich mit in der Falldatenbank 3 vorgehaltenen historischen Freigabefall-Containern solche vormaligen Austauschfälle identifiziert, die anhand der neuen Vorschriften neu bewertet werden müssen.The large language model LLM can access the regulations database 9 in order to obtain the respective regulations and to take them into account when generating the regulatory compliance assessment. Even newly generated regulations can be added to the regulations database 9. The data release system 1 can execute a script 12 which recognizes the addition of new regulations to the regulations database 9 and, by comparing them with historical release case containers held in the case database 3, identifies those previous exchange cases which need to be reassessed based on the new regulations.

Angedeutet durch einen Pfeil 201 können Anwender über das Service- und Ticketingsystem die Falldatenbank 3 auslesen und somit alle für jeweilige Austauschfälle relevanten Informationen auch nachträglich händisch überprüfen. Angedeutet durch einen Pfeil 202 werden nach Bedarf (auch automatisch durch das Skript 12) neue Anfragen 10 für besagte historische Freigabefall-Container übermittelt.Indicated by an arrow 201, users can read the case database 3 via the service and ticketing system and thus manually check all information relevant to the respective exchange cases at a later date. Indicated by an arrow 202, new requests 10 for the said historical release case containers are transmitted as required (also automatically by the script 12).

Mit Hilfe des erfindungsgemäßen Datenfreigabesystems lässt sich der Aufwand zur Bewertung entsprechender Datenaustauschfälle auf ein Minimum reduzieren. Neue Datenaustauschfälle können somit durch fachkundige Personen schnell überprüft werden. Um Fehler zu vermeiden, kann es dabei auch erforderlich sein, dass zuerst eine manuelle Freigabe eines durch das Datenfreigabesystem 1 freigegebenen Datenaustauschfalls erfolgen muss. Datenaustauschfälle lassen sich zuverlässig bewerten, da, bedingt durch die Fähigkeit große Datenmengen in kurzer Zeit zu verarbeiten, eine Vielzahl vormaliger Bewertungen von historischen Freigabefall-Container berücksichtigt werden können. Zudem ist es möglich das Bewertungsschema des großen Sprachmodells LLM durch ein beständiges Training zu optimieren. Ferner lassen sich neue Vorschriften durch das Datenfreigabesystem 1 nahezu in Echtzeit ableiten. Änderungen des geltenden Rechts können schnell und zuverlässig berücksichtigt werden.With the help of the data release system according to the invention, the effort required to evaluate corresponding data exchange cases can be reduced to a minimum. New data exchange cases can thus be quickly checked by experts. In order to avoid errors, it may also be necessary to first manually release a data exchange case released by the data release system 1. Data exchange cases can be reliably evaluated because, due to the ability to process large amounts of data in a short time, a large number of previous evaluations of historical release case containers can be taken into account. In addition, it is possible to optimize the evaluation scheme of the large language model LLM through constant training. Furthermore, new regulations can be derived by the data release system 1 almost in real time. Changes to the applicable law can be taken into account quickly and reliably.

ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDED IN THE DESCRIPTION

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of documents listed by the applicant was generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA accepts no liability for any errors or omissions.

Zitierte PatentliteraturCited patent literature

  • US 2023/0315981 A1 [0006]US 2023/0315981 A1 [0006]

Claims (9)

Datenfreigabesystem (1) zur Weitergabe von Daten an eine Drittpartei in Übereinkunft mit, eine jeweilige Weitergabe betreffenden Vorschriften, umfassend Mittel zur Verarbeitung der weiterzugebenden Daten mittels künstlicher Intelligenz, gekennzeichnet durch - eine Empfangsschnittstelle (2), dazu eingerichtet einen Freigabefall-Container zu empfangen, umfassend einen Datensatz, eine Datensatzbeschreibung und einen Datensatzkontext, wobei die Datensatzbeschreibung eine Beschreibung des Datensatzes und der Datensatzkontext einen Grund für die Weitergabe des Datensatzes an eine Drittpartei jeweils in computerverarbeitbarer Form umfassen; - eine Falldatenbank (3), umfassend historische Freigabefall-Container, wobei die Empfangsschnittstelle (2) dazu eingerichtet ist einen empfangenen Freigabefall-Container in der Falldatenbank (3) zu speichern; - ein Evaluierungsmodul (4), dazu eingerichtet den Freigabefall-Container und wenigstens einen historischen Freigabefall-Container mittels eines großen Sprachmodells (LLM) zu verarbeiten, wobei das große Sprachmodell (LLM) dazu trainiert ist durch einen Vergleich des Freigabefall-Containers mit dem wenigstens einen historischen Freigabefall-Container eine Vorschrifteneinhaltungsbewertung zu erzeugen, umfassend eine Beschreibung in welchem Ausmaß der Freigabefall-Container die die Weitergabe betreffenden Vorschriften erfüllt; und - eine Ausgabeschnittstelle (5), dazu eingerichtet zumindest den Datensatz unter Berücksichtigung der Vorschrifteneinhaltungsbewertung an die Drittpartei weiterzugeben, wenn der Freigabefall-Container den Vorschriften zumindest bis zu einem festgelegten Erfüllungsschwellwert gerecht wird.Data release system (1) for forwarding data to a third party in agreement with regulations relating to a respective forwarding, comprising means for processing the data to be forwarded using artificial intelligence, characterized by - a receiving interface (2) set up to receive a release case container comprising a data set, a data set description and a data set context, wherein the data set description comprises a description of the data set and the data set context comprises a reason for forwarding the data set to a third party, each in computer-processable form; - a case database (3) comprising historical release case containers, wherein the receiving interface (2) is set up to store a received release case container in the case database (3); - an evaluation module (4) configured to process the release case container and at least one historical release case container by means of a large language model (LLM), wherein the large language model (LLM) is trained to generate a compliance assessment by comparing the release case container with the at least one historical release case container, comprising a description of the extent to which the release case container complies with the regulations relating to the transfer; and - an output interface (5) configured to at least forward the data set to the third party taking into account the compliance assessment if the release case container complies with the regulations at least up to a specified compliance threshold. Datenfreigabesystem (1) nach Anspruch 1, gekennzeichnet durch - eine Überprüfungsschnittstelle (6), dazu eingerichtet den Freigabefall-Container und die Vorschrifteneinhaltungsbewertung an einen Nutzer (7) auszugeben und eine Vorschrifteneinhaltungsaussage (11) von dem Nutzer (7) zu empfangen, wobei die Vorschrifteneinhaltungsaussage (11) eine durch den Nutzer (7) bestätigte, abgelehnte oder korrigierte Vorschrifteneinhaltungsbewertung umfasst; und - ein Lernmodul (8), dazu eingerichtet die Vorschrifteneihaltungsaussage (11) in den Freigabefall-Container zu inkludieren und durch den Einsatz eines Modells des bestärkenden Lernens (REM) in Abhängigkeit des Inhalts der Vorschrifteneinhaltungsaussage (11) eine Eingabeaufforderung für das große Sprachmodell (LLM) zu formulieren und diese an das Evaluierungsmodul (4) für die nächste Evaluierung eines Freigabefall-Containers zu übermitteln.Data release system (1) according to claim 1 , characterized by - a verification interface (6) configured to output the release case container and the compliance assessment to a user (7) and to receive a compliance statement (11) from the user (7), wherein the compliance statement (11) comprises a compliance assessment confirmed, rejected or corrected by the user (7); and - a learning module (8) configured to include the compliance statement (11) in the release case container and, by using a reinforcement learning model (REM), to formulate an input request for the large language model (LLM) depending on the content of the compliance statement (11) and to transmit this to the evaluation module (4) for the next evaluation of a release case container. Datenfreigabesystem (1) nach Anspruch 2, dadurch gekennzeichnet, dass das Evaluierungsmodul (4) dazu eingerichtet ist die Vorschrifteneinhaltungsbewertung für einen Freigabefall-Container unter Berücksichtigung einer vom Lernmodul (8) formulierten Eingabeaufforderung und/oder einer in den Freigabefall-Container oder einen historischen Freigabefall-Container inkludierten Vorschrifteneinhaltungsaussage (11) zu erzeugen.Data release system (1) according to claim 2 , characterized in that the evaluation module (4) is configured to generate the compliance assessment for a release case container taking into account an input request formulated by the learning module (8) and/or a compliance statement (11) included in the release case container or a historical release case container. Datenfreigabesystem (1) nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass das Evaluierungsmodul (4) dazu eingerichtet ist mittels des großen Sprachmodells (LLM) im Zuge der Erzeugung der Vorschrifteneinhaltungsbewertung eine Referenzinformation zu erzeugen, umfassend wenigstens eine Referenz zu einem historischen Freigabefall-Container auf dessen Ausmaß des Erfüllens der Vorschriften basierend das große Sprachmodell (LLM) die Vorschrifteneinhaltungsbewertung für den Freigabefall-Container erzeugt.Data release system (1) according to one of the Claims 1 until 3 , characterized in that the evaluation module (4) is configured to generate reference information by means of the large language model (LLM) in the course of generating the regulatory compliance assessment, comprising at least one reference to a historical release case container based on the extent of compliance with the regulations, the large language model (LLM) generates the regulatory compliance assessment for the release case container. Datenfreigabesystem (1) nach einem der Ansprüche 1 bis 4, gekennzeichnet durch eine Vorschriftendatenbank (9), umfassend die Weitergabe von Daten betreffende Vorschriften, wobei die Vorschriftendatenbank (9) dazu eingerichtet ist neue Vorschriften aufzunehmen und/oder eine bereits gespeicherte Vorschrift durch eine aktualisierte Vorschrift anzupassen, und wobei das Evaluierungsmodul (4) dazu eingerichtet ist die Vorschrifteneinhaltungsbewertung für einen Freigabefall-Container unter Berücksichtigung der in der Vorschriftendatenbank (9) vorgehaltenen Vorschriften zu erzeugen.Data release system (1) according to one of the Claims 1 until 4 , characterized by a regulations database (9) comprising regulations relating to the transfer of data, wherein the regulations database (9) is set up to record new regulations and/or to adapt an already stored regulation by an updated regulation, and wherein the evaluation module (4) is set up to generate the regulatory compliance assessment for a release case container taking into account the regulations held in the regulations database (9). Datenfreigabesystem (1) nach Anspruch 5, dadurch gekennzeichnet, dass das Evaluierungsmodul (4) dazu eingerichtet ist einen historischen Freigabefall-Container durch das Erzeugen der Vorschrifteneinhaltungsbewertung unter Berücksichtigung neuer und/oder ergänzter Vorschriften und/oder eines geänderten Inhalts des respektiven historischen Freigabefall-Containers neu zu bewerten.Data release system (1) according to claim 5 , characterized in that the evaluation module (4) is configured to re-evaluate a historical release case container by generating the compliance assessment taking into account new and/or supplemented regulations and/or a changed content of the respective historical release case container. Datenfreigabesystem (1) nach Anspruch 5 oder 6, dadurch gekennzeichnet, dass das Evaluierungsmodul (4) dazu eingerichtet ist Vorschriften in Abhängigkeit von durch die Verarbeitung eines Freigabefall-Containers und/oder eines historischen Freigabefall-Containers identifizierte Bewertungsmuster zu formulieren, selbst formulierte Vorschriften mit den in der Vorschriftendatenbank (9) vorgehaltenen Vorschriften abzugleichen und eine selbst formulierte Vorschrift in der Vorschriftendatenbank (9) zu ergänzen, wenn die selbst formulierte Vorschrift über ein festgelegtes Maß von sämtlichen bisher in der Vorschriftendatenbank (9) vorgehaltenen Vorschriften abweicht.Data release system (1) according to claim 5 or 6 , characterized in that the evaluation module (4) is set up to formulate regulations depending on evaluation patterns identified by processing a release case container and/or a historical release case container, to compare self-formulated regulations with the regulations held in the regulations database (9) and to supplement a self-formulated regulation in the regulations database (9) if the self-formulated regulation deviates by a specified amount from all regulations previously held in the regulations database (9). Verfahren zum Trainieren eines von einem Evaluierungsmodul (4) eines Datenfreigabesystems (1) nach einem der Ansprüche 2 bis 7 einsetzbaren großen Sprachmodells (LLM), dadurch gekennzeichnet, dass das große Sprachmodell (LLM) die selbst erzeugte Vorschrifteneinhaltungsbewertung und die vom Nutzer (7) erzeugte Vorschrifteneinhaltungsaussage (11) für denselben Freigabefall-Container einliest, wobei das große Sprachmodell (LLM) die Vorschrifteneinhaltungsaussage (11) als Grundwahrheit betrachtet.Method for training a data release system (1) evaluated by an evaluation module (4) according to one of the Claims 2 until 7 deployable large language model (LLM), characterized in that the large language model (LLM) reads in the self-generated compliance assessment and the compliance statement (11) generated by the user (7) for the same release case container, wherein the large language model (LLM) considers the compliance statement (11) as ground truth. Verfahren zum Trainieren eines von einem Lernmodul (8) eines Datenfreigabesystems (1) nach einem der Ansprüche 2 bis 7 einsetzbaren Modells des bestärkenden Lernens (REM), gekennzeichnet durch die folgenden Verfahrensschritte: - Einlesen der vom Nutzer (7) erzeugten Vorschrifteneinhaltungsaussage (11) in das Modell des bestärkenden Lernens (REM); - Abändern der für das große Sprachmodell (LLM) formulierten Eingabeaufforderung, wenn die Vorschrifteneinhaltungsaussage (11) eine Änderung oder eine Ablehnung der vom großen Sprachmodell (LLM) erzeugten Vorschrifteneinhaltungsbewertung umfasst; und - erneutes Durchführen der beiden vorigen Verfahrensschritte so lange, bis die Vorschrifteneinhaltungsaussage (11) eine Bestätigung der Vorschrifteneinhaltungsbewertung umfasst.Method for training a learning module (8) of a data release system (1) according to one of the Claims 2 until 7 deployable reinforcement learning model (REM), characterized by the following method steps: - reading the compliance statement (11) generated by the user (7) into the reinforcement learning model (REM); - modifying the input prompt formulated for the large language model (LLM) if the compliance statement (11) includes a modification or rejection of the compliance assessment generated by the large language model (LLM); and - repeating the two previous method steps until the compliance statement (11) includes a confirmation of the compliance assessment.
DE102024000441.6A 2024-02-10 2024-02-10 Data sharing system and method for training artificial intelligence Withdrawn DE102024000441A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102024000441.6A DE102024000441A1 (en) 2024-02-10 2024-02-10 Data sharing system and method for training artificial intelligence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102024000441.6A DE102024000441A1 (en) 2024-02-10 2024-02-10 Data sharing system and method for training artificial intelligence

Publications (2)

Publication Number Publication Date
DE102024000441A1 true DE102024000441A1 (en) 2025-01-09
DE102024000441A8 DE102024000441A8 (en) 2025-02-27

Family

ID=93931342

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102024000441.6A Withdrawn DE102024000441A1 (en) 2024-02-10 2024-02-10 Data sharing system and method for training artificial intelligence

Country Status (1)

Country Link
DE (1) DE102024000441A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022133267A1 (en) 2020-12-18 2022-06-23 Paypal, Inc. Data lifecycle discovery and management
US20230315981A1 (en) 2022-03-31 2023-10-05 Wipro Limited Method and system for determining quality of a document during risk & compliance assessment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022133267A1 (en) 2020-12-18 2022-06-23 Paypal, Inc. Data lifecycle discovery and management
US20230315981A1 (en) 2022-03-31 2023-10-05 Wipro Limited Method and system for determining quality of a document during risk & compliance assessment

Also Published As

Publication number Publication date
DE102024000441A8 (en) 2025-02-27

Similar Documents

Publication Publication Date Title
DE112009002000B4 (en) Adaptive method and device for converting messages between different data formats
DE202017007066U1 (en) System and device for automatically categorizing and evaluating billing rates
WO2008040664A1 (en) Method for the computer-assisted analysis of a software source code
DE102015121509A1 (en) Methodology and device for consistency check by comparison of ontology models
DE112020000004T5 (en) Information delivery system and information delivery process
DE112020003888T5 (en) DE-IDENTIFICATION CODE FOR CROSS-ORGANIZATION TROUBLESHOOTING KNOWLEDGE
DE102005046992A1 (en) Procedure and system for risk management
DE102012100392A1 (en) Efficient source for determining inaccuracy in timed automata tracks
DE102024000441A1 (en) Data sharing system and method for training artificial intelligence
DE102016114265A1 (en) Method for at least partially machine transferring a word sequence written in a source language into a word sequence of a target language
DE102024002821A1 (en) Methods for improving the reliability of the output of a Large Language Model
DE102013202376A1 (en) Systems and methods for generating high quality formal software executable requirements
EP2810191A1 (en) Assigning measurement signal and device designations from a first classification system to a second classification system within a projection of a technical system
DE102024134656B3 (en) Method and device for generating a logic-based evaluation result
DE102024000277A1 (en) Contract management device and method for training artificial intelligence
DE102016217191A1 (en) Method for selecting and evaluating a plurality of data records from at least one data source
DE102024103861A1 (en) Method for generating software components
CN115796285B (en) Litigation case pre-judging method and device based on engineering model and electronic equipment
DE102024004449A1 (en) database system
DE102024002222A1 (en) Information technology system for assessing the compliant processing of data
WO2020025119A1 (en) Computer-implemented method for detecting document content from a document
DE102025131217A1 (en) Computer-implemented system and procedure for verifying the legitimacy of an intended use of data
DE102024103183A1 (en) Analysis system and method for controlling an analysis of at least one patent claim
DE102020129099A1 (en) Method for the computer-implemented assignment of documents intended for a certified translation
CN121329300A (en) Business analysis methods, devices, equipment, storage media, and software products

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R230 Request for early publication
R120 Application withdrawn or ip right abandoned