DE102024111500A1 - Method and system for edge case detection in vehicle camera images - Google Patents
Method and system for edge case detection in vehicle camera imagesInfo
- Publication number
- DE102024111500A1 DE102024111500A1 DE102024111500.9A DE102024111500A DE102024111500A1 DE 102024111500 A1 DE102024111500 A1 DE 102024111500A1 DE 102024111500 A DE102024111500 A DE 102024111500A DE 102024111500 A1 DE102024111500 A1 DE 102024111500A1
- Authority
- DE
- Germany
- Prior art keywords
- image
- vehicle
- word
- language model
- traffic scenarios
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Traffic Control Systems (AREA)
Abstract
Die vorliegende Erfindung betrifft ein Verfahren zur Randfall-Detektion in Fahrzeugkamerabildern, bei dem ein erstes großes visuelles Sprachmodell (22) mit Bild-Wort-Paaren trainiert wird, wobei ein jeweiliges Wort einem Katalog von Verkehrsszenarien (21) entnommen wird, bei dem ein zweites großes visuelles Sprachmodell (32) mit Bild-Wort-Paaren trainiert wird, wobei ein jeweiliges Wort einem allgemeinen Wörterbuch (31) entnommen wird, bei dem während einer Fahrt eines Fahrzeugs von mindestens einer auf ein Fahrzeugvorfeld ausgerichteten Fahrzeugkamera in ständiger Ausführung Umgebungsbilder (11) aufgenommen und an eine im Fahrzeug angeordnete Auswertungseinheit geleitet werden, bei dem durch die Auswertungseinheit ein jeweiliges Umgebungsbild gemäß dem ersten und zweiten großen visuellen Sprachmodell analysiert werden und mindestens ein darin identifiziertes Bild-Wort-Paar einer ersten und entsprechend zweiten Analysegruppe zugeordnet wird, bei dem mindestens ein nicht im Katalog von Verkehrsszenarien enthaltenes Bild-Wort-Paar der zweiten Analysegruppe einer Differenzgruppe zugeordnet wird, und bei dem jeweilige Analysedaten und ein jeweiliges Umgebungsbild zu dem mindestens einen Bild-Wort-Paar der Differenzgruppe als ein Randfall-Szenario an einen Cloud-Server (50) übermittelt (45) werden. Ferner wird ein System, auf welchem das Verfahren ausführbar ist, vorgestellt. The present invention relates to a method for edge case detection in vehicle camera images, in which a first large visual language model (22) is trained with image-word pairs, wherein a respective word is taken from a catalog of traffic scenarios (21), in which a second large visual language model (32) is trained with image-word pairs, wherein a respective word is taken from a general dictionary (31), in which, during a vehicle's journey, environmental images (11) are continuously recorded by at least one vehicle camera directed towards the vehicle's forecourt and transmitted to an evaluation unit arranged in the vehicle, in which the evaluation unit analyzes a respective environmental image according to the first and second large visual language models and assigns at least one image-word pair identified therein to a first and corresponding second analysis group, in which at least one image-word pair not included in the catalog of traffic scenarios is assigned to a difference group of the second analysis group, and in which respective analysis data and a respective environmental image at least one image-word pair of the difference group is transmitted as a marginal case scenario to a cloud server (50) (45). Furthermore, a system on which the procedure can be executed is presented.
Description
Die vorliegende Erfindung betrifft ein Verfahren zu einer Randfall-Detektion in Fahrzeugkamerabildern. Ferner wird ein System, auf welchem das Verfahren ausführbar ist, vorgestellt.The present invention relates to a method for edge case detection in vehicle camera images. Furthermore, a system on which the method can be implemented is presented.
Es gibt im Straßenverkehr eine Vielzahl untypischer Verkehrsszenarien, bspw. dass ein Rind über eine Autobahn läuft, welche für ein Szenario-basiertes Testen bei einer Erstellung eines Szenarien- und Testkatalogs für eine autonome Fahrfunktion nicht mit aufgenommen werden können, da es sich um bis zu ihrem Auftreten unbekannte Szenarien handelt. Eine Identifikation solcher Randfälle, bspw. in von Fahrzeugkameras bereitgestellten Bildern bzw. Daten, ist nicht trivial, da schon im Vorfeld Objektdetektoren anhand von bereits bekannten Szenarien für eine Erkennung bestimmter darin enthaltener Objekte, bspw. Fußgänger oder Fahrzeuge, trainiert sind und dann eine semantische Information, welche einen bis dato unbekannten Randfall - im Englischen als Corner-Case oder Edge-Case bezeichnet - beschreibt, ausbleibt. Zudem stellt eine Abarbeitung der schieren Menge an bspw. von einer Fahrzeugflotte bei Fahrten aufgezeichneten Bildern der jeweiligen Fahrzeugkameras ein datenanalytisches Problem dar.There are numerous atypical traffic scenarios in road traffic, such as a cow running across a highway. These cannot be included in scenario-based testing when creating a scenario and test catalog for an autonomous driving function because they are unknown until they occur. Identifying such edge cases, for example, in images or data provided by vehicle cameras, is not trivial. This is because object detectors are already trained on known scenarios to recognize specific objects, such as pedestrians or vehicles. Consequently, semantic information describing a previously unknown edge case—referred to as a corner case or edge case—is lacking. Furthermore, processing the sheer volume of images recorded by the individual vehicle cameras of, for example, a fleet of vehicles during journeys presents a significant data analysis challenge.
Ein visuelles Sprachmodell, abgekürzt mit VLM für Englisch „visual language model“, oder auch ein sogenanntes großes visuelles Sprachmodell mit einem gegenüber dem VLM erweiterten Wortschatz und mit LVLM für Englisch „large visual language model“ bezeichnet, sind Anwendungen des maschinellen Lernens, bei dem ein neuronales Netz darauf trainiert wird, visuelle Inhalte von einzelnen Bildern oder von Bildabläufen zu erkennen und sprachlichen Begriffe zuzuordnen.A visual language model, abbreviated VLM for "visual language model", or a so-called large visual language model with a vocabulary expanded compared to the VLM and referred to as LVLM for "large visual language model", are applications of machine learning in which a neural network is trained to recognize visual content from individual images or image sequences and assign it to linguistic terms.
Die Druckschrift
In der Druckschrift
Die Druckschrift
Vor diesem Hintergrund ist es eine Aufgabe der vorliegenden Erfindung, ein Verfahren zur Identifizierung von Randfall-Szenarien vorzustellen, bei dem eine reduzierte Datenmenge an einen Cloud-Server übermittelt wird. Die Identifizierung eines Randfall-Szenarios in Fahrzeugkamerabildern soll bereits in dem jeweiligen Fahrzeug erfolgen, so dass nur die zur Beschreibung des Randfalls notwendigen Daten anfallen. Ferner soll ein System vorgestellt werden, mit dem das Verfahren ausgeführt werden kann.Against this background, an object of the present invention is to present a method for identifying edge case scenarios in which a reduced amount of data is transmitted to a cloud server. The identification of an edge case scenario in vehicle camera images is intended to take place directly in the vehicle itself, so that only the data necessary to describe the edge case is generated. Furthermore, a system with which the method can be carried out is presented.
Zur Lösung der voranstehend genannten Aufgabe wird ein Verfahren zur Randfall-Detektion in Fahrzeugkamerabildern vorgeschlagen, bei dem ein erstes großes visuelles Sprachmodell mit Bild-Wort-Paaren trainiert wird, wobei ein jeweiliges Wort einem Katalog von Verkehrsszenarien entnommen wird. Zudem wird ein zweites großes visuelles Sprachmodell mit Bild-Wort-Paaren trainiert, wobei ein jeweiliges Wort einem allgemeinen Wörterbuch entnommen wird. Während einer Fahrt eines Fahrzeugs werden von mindestens einer auf ein Fahrzeugvorfeld ausgerichteten Fahrzeugkamera in ständiger Ausführung Umgebungsbilder aufgenommen und an eine im Fahrzeug angeordnete Auswertungseinheit geleitet. Durch die Auswertungseinheit wird ein jeweiliges Umgebungsbild gemäß dem ersten großen visuellen Sprachmodell analysiert und mindestens ein darin identifiziertes Bild-Wort-Paar einer ersten Analysegruppe zugeordnet. Durch die Auswertungseinheit wird das jeweilige Umgebungsbild gemäß dem zweiten großen visuellen Sprachmodell analysiert und mindestens ein darin identifiziertes Bild-Wort-Paar einer zweiten Analysegruppe zugeordnet. Mindestens ein nicht im Katalog von Verkehrsszenarien enthaltenes Bild-Wort-Paar der zweiten Analysegruppe wird einer Differenzgruppe zugeordnet. Jeweilige Analysedaten und ein jeweiliges Umgebungsbild zu dem mindestens einen Bild-Wort-Paar der Differenzgruppe werden als ein Randfall-Szenario an einen Cloud-Server übermittelt. Dadurch wird vorteilhaft eine zu übermittelnde Zahl von Umgebungsbildern durch Vorauswertung im Fahrzeug auf Bilder bzw. Daten zu Randfällen reduziert.To solve the aforementioned problem, a method for edge case detection in vehicle camera images is proposed. This method involves training a first large visual language model with image-word pairs, where each word is taken from a catalog of traffic scenarios. A second large visual language model is also trained with image-word pairs, where each word is taken from a general dictionary. During a vehicle's journey, at least one vehicle camera, focused on the area in front of the vehicle, continuously captures images of the surroundings and transmits them to an evaluation unit located within the vehicle. The evaluation unit analyzes each image of the surroundings according to the first large visual language model and assigns at least one identified image-word pair to a first analysis group. The evaluation unit then analyzes each image of the surroundings according to the second large visual language model and assigns at least one identified image-word pair to a second analysis group. At least one image-word pair from the second analysis group that is not included in the catalog of traffic scenarios is assigned to a difference group. Each analysis data set and corresponding environmental image for at least one image-word pair of the difference group are transmitted to a cloud server as a boundary case scenario. This advantageously reduces the number of environmental images to be transmitted by pre-evaluating them in the vehicle, focusing on images or data relevant to boundary cases.
Mittels des erfindungsgemäßen Verfahrens können im Fahrzeugvorfeld aufgenommene ungewöhnliche Situationen in den Fahrzeugkamerabildern identifiziert werden und damit eine Rückmeldung der aufgenommenen Bilder an den Cloud-Server bzw. von diesem an einen zentralen Server, bspw. stationiert beim Fahrzeughersteller oder in einem Entwicklungszentrum für autonome Fahrsysteme bzw. Fahrerassistenzsysteme, auf ein verglichen mit einer Gesamtheit aller während Fahrten bspw. einer Fahrzeugflotte aufgenommenen Bilder weitaus geringeres Maß eingeschränkt werden. Weiter vorteilhaft erübrigt sich damit auch eine zusätzlich datenanalytische Behandlung der übermittelten Daten, um solche Randfall-Szenarien herausfinden zu müssen.Using the method according to the invention, unusual situations recorded in the vehicle's camera images can be identified in the vehicle's approach path. This significantly reduces the amount of recorded images that need to be sent back to the cloud server or from there to a central server, e.g., located at the vehicle manufacturer's premises or in a development center for autonomous driving systems or driver assistance systems, compared to the totality of all images recorded during journeys of, for example, a fleet of vehicles. Furthermore, this also eliminates the need for additional data analysis of the transmitted data to identify such edge case scenarios.
Es ist denkbar, dass die übermittelten Bilder bzw. Daten zu dem Randfall-Szenario unmittelbar zur Entwicklung eines Verkehrsszenarios und entsprechenden Fahrvorgaben für das autonome Fahrsystem herangezogen werden. Es ist weiter denkbar, dass diese Vorgänge automatisiert auf einem virtuellen Teststand zur Validierung autonomer Fahrsysteme ausgeführt werden.It is conceivable that the transmitted images or data relating to the edge case scenario could directly contribute to the development of a traffic scenario and the... The driving instructions for the autonomous driving system can be used. Furthermore, it is conceivable that these processes could be automated on a virtual test bench for the validation of autonomous driving systems.
Es versteht sich, dass das Training des ersten und zweiten großen visuellen Sprachmodells mit einer Vielzahl von Wörtern durchgeführt wird. Dies erfolgt bei dem Katalog von Verkehrsszenarien mit dem Ziel, alle bekannten Verkehrsszenarien durch Bild-Wort-Paare identifizieren zu können, und bei der Entnahme aus dem allgemeinen Wörterbuch mit dem Ziel, alle möglicherweise im Verkehrsgeschehen vorkommenden Objekte ebenfalls durch entsprechende Bild-Wort-Paare identifizieren zu können. Zu diesen möglicherweise vorkommenden Objekten zählen bspw. alle von Lastkraftwagen transportierbaren Dinge, welche bspw. bei einem Verlust einer Ladung auf einer Straße zum Hindernis werden könnten. Hingegen können weite Bereiche im allgemeinen Wörterbuch zu von Fahrzeugkameras nicht erfassbaren Objekten (bspw. auf Grund ihrer Größe) oder generell nichtmaterielle Dinge beschreibende Wörter (bspw. philosophische Begriffe) zum Training des zweiten großen visuellen Sprachmodells ausgespart werden.It goes without saying that the training of the first and second major visual language models is conducted using a large number of words. This is done with the catalog of traffic scenarios, with the goal of being able to identify all known traffic scenarios through image-word pairs, and with the general dictionary, with the goal of being able to identify all objects that might occur in traffic situations, also through corresponding image-word pairs. These potentially occurring objects include, for example, all items that can be transported by trucks and that could become an obstacle on a road if cargo were to be lost. Conversely, large sections of the general dictionary can be excluded from the training of the second major visual language model, containing words describing objects that cannot be detected by vehicle cameras (e.g., due to their size) or words describing non-material things in general (e.g., philosophical terms).
In einer Ausführungsform des erfindungsgemäßen Verfahrens werden jeweiligen Wörtern eine jeweilige Koordinate in einem auf Sprache bezogenen Phasenraum zugewiesen. Zwischen einzelnen Koordinaten wird ein Entfernungsmaß gebildet. In one embodiment of the method according to the invention, each word is assigned a respective coordinate in a phase space related to language. A distance measure is established between individual coordinates.
Zwei Wörter werden synonym gesetzt, falls durch das zu ihnen gebildete Entfernungsmaß eine vorgegebene Obergrenze unterschritten wird. Das Entfernungsmaß kann in einem lexikalisch-semantischen Wortnetz definiert werden, wie es bspw durch WordNet® (https://wordnet.princeton.edu/) bereitgestellt ist.Two words are considered synonymous if the distance measure calculated for them falls below a predefined upper limit. This distance measure can be defined in a lexical-semantic word network, such as that provided by WordNet® (https://wordnet.princeton.edu/).
In einer weiteren Ausführungsform des erfindungsgemäßen Verfahrens wird von dem Cloud-Server das von dem Fahrzeug übermittelte Randfall-Szenario einer Instanz zur Entwicklung einer entsprechenden Fahrfunktion zugeleitet. Diese Instanz ist bspw. ein virtueller Teststand zur Entwicklung autonomer Fahrsysteme, auf dem eine Vielzahl von Fahrfunktionen als Reaktion auf das Auftreten des Randfall-Szenarios durchprobiert werden und nur diejenigen zur Umsetzung in dem autonomen Fahrsystem verbleiben, welche eine ungestörte Weiterfahrt ermöglichen.In a further embodiment of the method according to the invention, the edge case scenario transmitted by the vehicle is forwarded from the cloud server to an instance for the development of a corresponding driving function. This instance is, for example, a virtual test bench for the development of autonomous driving systems, on which a multitude of driving functions are tested in response to the occurrence of the edge case scenario, and only those that enable uninterrupted driving are retained for implementation in the autonomous driving system.
In einer fortgesetzt weiteren Ausführungsform des erfindungsgemäßen Verfahrens wird nach erfolgter Entwicklung einer zu dem Randfall-Szenario angepassten Fahrfunktion der Katalog von Verkehrsszenarien um das Randfall-Szenario erweitert. Der Katalog von Verkehrsszenarien wird mit entsprechenden den jeweiligen Verkehrsszenarien zugeordneten Fahrfunktionen an das Fahrzeug übermittelt.In a further embodiment of the method according to the invention, after the development of a driving function adapted to the edge case scenario, the catalog of traffic scenarios is extended to include the edge case scenario. The catalog of traffic scenarios, along with the corresponding driving functions assigned to each traffic scenario, is transmitted to the vehicle.
In einer noch weiteren Ausführungsform des erfindungsgemäßen Verfahrens wird das Fahrzeug durch ein autonomes Fahrsystem oder ein Fahrerassistenzsystem gemäß dem Katalog von Verkehrsszenarien und jeweilig entsprechender Fahrfunktionen gesteuert.In a further embodiment of the method according to the invention, the vehicle is controlled by an autonomous driving system or a driver assistance system according to the catalog of traffic scenarios and the respective corresponding driving functions.
Ferner wird ein System beansprucht, wobei das System ein Fahrzeug, das mindestens eine auf ein Fahrzeugvorfeld ausgerichtete Fahrzeugkamera, eine Auswertungseinheit mit einem Computerprozessor und ein Speichermedium, ein auf dem Speichermedium abgespeichertes und auf dem Computerprozessor ausführbares erstes und zweites großes visuelles Sprachmodell, und Mittel zur Funkkommunikation aufweist, und einen Cloud-Server umfasst. Das erste große visuelle Sprachmodell ist mit Bild-Wort-Paaren, wobei ein jeweiliges Wort einem Katalog von Verkehrsszenarien entnommen ist, trainiert. Das zweite große visuelle Sprachmodell ist mit Bild-Wort-Paaren, wobei ein jeweiliges Wort einem allgemeinen Wörterbuch entnommen ist, trainiert. Die Auswertungseinheit ist dazu konfiguriert, in ständiger Ausführung
- • während einer Fahrt des Fahrzeugs von der mindestens einen Fahrzeugkamera Umgebungsbilder zu empfangen,
- • ein jeweiliges Umgebungsbild gemäß dem ersten großen visuellen Sprachmodell zu analysieren und mindestens ein darin identifiziertes Bild-Wort-Paar einer ersten Analysegruppe zuzuordnen,
- • das jeweilige Umgebungsbild gemäß dem zweiten großen visuellen Sprachmodell zu analysieren und mindestens ein darin identifiziertes Bild-Wort-Paar einer zweiten Analysegruppe zuzuordnen,
- • mindestens ein nicht im Katalog von Verkehrsszenarien enthaltenes Bild-Wort-Paar der zweiten Analysegruppe einer Differenzgruppe zuzuordnen, und
- • jeweilige Analysedaten und das jeweiliges Umgebungsbild zu dem mindestens einen Bild-Wort-Paar der Differenzgruppe als ein Randfall-Szenario per Funkkommunikation an den Cloud-Server zu übermitteln.
- • to receive images of the surroundings from at least one vehicle camera while the vehicle is in motion,
- • to analyze a given environmental image according to the first major visual language model and to assign at least one identified image-word pair to a first analysis group,
- • to analyze the respective environment according to the second major visual language model and to assign at least one image-word pair identified therein to a second analysis group,
- • to assign at least one image-word pair not included in the catalog of traffic scenarios to the second analysis group of a difference group, and
- • to transmit the respective analysis data and the respective environmental image to the cloud server via radio communication as a marginal case scenario for at least one image-word pair of the difference group.
Das erfindungsgemäße System ermöglicht damit vorteilhaft eine Reduzierung einer Datenmenge zur Übertragung von Bildern aus der mindestens einen auf das Fahrzeugvorfeld ausgerichteten Fahrzeugkamera an den Cloud-Server bzw. zentralen Server zur Analyse von Randfall-Szenarien. Dies wird mittels einer im Fahrzeug eingebetteten Auswertungseinheit (Englisch „Embedding“) zur Extraktion semantischer Attribute aus den Kamerabildern erreicht. So können neue untypische (da bislang im Katalog von Verkehrsszenarien nicht vorhandene) Objekte erkannt werden. Zudem können zwar bereits bekannte (da im allgemeinen Wörterbuch vorhandene) Objekte (bspw. ein Rind, s.
In einer Ausgestaltung des erfindungsgemäßen Systems sind jeweiligen Wörtern eine jeweilige Koordinate in einem auf Sprache bezogenen Phasenraum zugewiesen. Zwischen einzelnen Koordinaten ist ein Entfernungsmaß gebildet. Die Auswertungseinheit ist dazu konfiguriert, zwei Wörter, deren zu ihnen gebildetes Entfernungsmaß eine vorgegebene Obergrenze unterschreitet, synonym zu setzen. In one embodiment of the system according to the invention, each word is assigned a specific coordinate in a language-related phase space. A distance measure is established between individual coordinates. The evaluation unit is configured to treat two words whose distance measure falls below a predefined upper limit as synonymous.
In einer weiteren Ausgestaltung des erfindungsgemäßen Systems ist der Cloud-Server dazu konfiguriert, das von dem Fahrzeug übermittelte Randfall-Szenario einer Instanz zur Entwicklung einer entsprechenden Fahrfunktion zuzuleiten.In a further embodiment of the system according to the invention, the cloud server is configured to forward the edge case scenario transmitted by the vehicle to an instance for the development of a corresponding driving function.
In einer fortgesetzt weiteren Ausgestaltung des erfindungsgemäßen Systems ist der Cloud-Server dazu konfiguriert, eine zu dem Randfall-Szenario von der Instanz entwickelte Fahrfunktion und den um das Randfall-Szenario erweiterten Katalog von Verkehrsszenarien mit entsprechenden den jeweiligen Verkehrsszenarien zugeordneten Fahrfunktionen an das Fahrzeug zu übermitteln.In a further embodiment of the system according to the invention, the cloud server is configured to transmit a driving function developed by the instance for the edge case scenario and the catalog of traffic scenarios extended by the edge case scenario with corresponding driving functions assigned to the respective traffic scenarios to the vehicle.
In einer noch weiteren Ausgestaltung des erfindungsgemäßen Systems, umfasst das System ein autonomes Fahrsystem oder ein Fahrerassistenzsystem. Das autonome Fahrsystem oder das Fahrerassistenzsystem sind dazu konfiguriert, gemäß dem Katalog von Verkehrsszenarien entsprechende Fahrfunktionen auszuführen.In a further embodiment of the system according to the invention, the system comprises an autonomous driving system or a driver assistance system. The autonomous driving system or the driver assistance system is configured to execute corresponding driving functions according to the catalog of traffic scenarios.
Weitere Vorteile und Ausgestaltungen der Erfindung ergeben sich aus der Beschreibung und der beiliegenden Zeichnung.Further advantages and embodiments of the invention will become apparent from the description and the accompanying drawing.
Es versteht sich, dass die voranstehend genannten und die nachstehend noch zu erläuternden Merkmale nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar sind, ohne den Rahmen der vorliegenden Erfindung zu verlassen.
-
1 zeigt ein Ablaufschema zu einer Ausführungsform des erfindungsgemäßen Verfahrens.
-
1 shows a flowchart for an embodiment of the method according to the invention.
In
BezugszeichenlisteList of reference symbols
- 1010
- AblaufschemaFlowchart
- 1111
- Umgebungsbilder von FahrzeugkameraSurround images from vehicle camera
- 1414
- RindBeef
- 1515
- Personperson
- 2121
- Entitäten als Wörter aus SzenarienkatalogEntities as words from scenario catalog
- 2222
- Trainiertes großes Bild-SprachmodellTrained large image-language model
- 2323
- Ähnlichkeitsmaß für erste AnalysegruppeSimilarity measure for first analysis group
- 2424
- Personperson
- 2525
- Landstraßecountry road
- 2626
- Fahrstraßeroad
- 3131
- Entitäten als Wörter aus allgemeinem WörterbuchEntities as words from a general dictionary
- 3232
- Trainiertes großes Bild-SprachmodellTrained large image-language model
- 3333
- Ähnlichkeitsmaß für zweite AnalysegruppeSimilarity measure for second analysis group
- 3434
- RindBeef
- 3535
- MenschenPeople
- 3636
- StraßeStreet
- 4040
- ZuweisungsschrittAssignment step
- 4141
- VerkehrsszenariengruppeTraffic Scenarios Group
- 4242
- ZuführungSupply
- 4343
- ZuführungSupply
- 4545
- Übermittlungtransmission
- 5050
- Cloud-ServerCloud server
ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES CONTAINED IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of documents cited by the applicant was automatically generated and is included solely for the reader's convenience. The list is not part of the German patent or utility model application. The DPMA accepts no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- CN 117073701 A [0004]CN 117073701 A [0004]
- WO 2022/187063 A1 [0005]WO 2022/187063 A1 [0005]
- US 2023/0154213 A1 [0006]US 2023/0154213 A1 [0006]
Claims (10)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102024111500.9A DE102024111500A1 (en) | 2024-04-24 | 2024-04-24 | Method and system for edge case detection in vehicle camera images |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102024111500.9A DE102024111500A1 (en) | 2024-04-24 | 2024-04-24 | Method and system for edge case detection in vehicle camera images |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE102024111500A1 true DE102024111500A1 (en) | 2025-10-30 |
Family
ID=97303987
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE102024111500.9A Pending DE102024111500A1 (en) | 2024-04-24 | 2024-04-24 | Method and system for edge case detection in vehicle camera images |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE102024111500A1 (en) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2022187063A1 (en) * | 2021-03-05 | 2022-09-09 | Microsoft Technology Licensing, Llc | Cross-modal processing for vision and language |
| US20230154213A1 (en) * | 2021-11-16 | 2023-05-18 | Salesforce.Com, Inc. | Systems and methods for open vocabulary object detection |
| CN117073701A (en) * | 2023-07-05 | 2023-11-17 | 西北工业大学 | A visual language navigation technology solution based on multi-modal perception model and large language model |
-
2024
- 2024-04-24 DE DE102024111500.9A patent/DE102024111500A1/en active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2022187063A1 (en) * | 2021-03-05 | 2022-09-09 | Microsoft Technology Licensing, Llc | Cross-modal processing for vision and language |
| US20230154213A1 (en) * | 2021-11-16 | 2023-05-18 | Salesforce.Com, Inc. | Systems and methods for open vocabulary object detection |
| CN117073701A (en) * | 2023-07-05 | 2023-11-17 | 西北工业大学 | A visual language navigation technology solution based on multi-modal perception model and large language model |
Non-Patent Citations (2)
| Title |
|---|
| HUANG, Yu: Selection of Valuable Data in Autonomous Driving’s Data Closed Loop Engine. 29.04.2023. URL: https://yuhuang-63908.medium.com/selection-of-valuable-data-in-autonomous-drivings-data-closed-loop-engine-5fb42b4ff656 [abgerufen am 05.02.2025] * |
| RADFORD, Alec [et al.]: Learning transferable visual models from natural language supervision. In: International conference on machine learning. PMLR, 2021. S. 8748-8763 * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE112017008149B4 (en) | Device for communication from a vehicle, method for communicating from a vehicle to the outside, information processing device and computer-readable medium | |
| EP3948688B1 (en) | Training for artificial neural networks with better utilization of learning data records | |
| DE102017008430A1 (en) | Methods and systems for generating virtual reality environments from electronic documents | |
| DE102016003424B4 (en) | Method and device for recognizing traffic signs | |
| EP3393875B1 (en) | Method for the improved detection of objects by a driver assistance system | |
| WO2014118178A1 (en) | Creation of an environment model for a vehicle | |
| DE102020131657A1 (en) | Diagnosing a perceptual system based on scene continuity | |
| DE102018213844A1 (en) | Method for testing an at least partially automated driving function for motor vehicles | |
| DE102016124888A1 (en) | A method for assisting a driver of a motor vehicle when parking using a driver assistance device, corresponding computer program product and driver assistance device | |
| DE102020103201A1 (en) | Procedure for testing scenarios for ADAS | |
| EP4125005B1 (en) | Kontrastives representation learning für messdaten | |
| DE112022003908T5 (en) | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, SERVER DEVICE, VEHICLE DEVICE AND INFORMATION PROCESSING PROGRAM | |
| DE102019129029A1 (en) | OBJECT DETECTION SYSTEM AND METHOD | |
| DE102024111500A1 (en) | Method and system for edge case detection in vehicle camera images | |
| DE102020005467A1 (en) | Process for making anonymized, ADAS-relevant vehicle data available | |
| DE102021207613A1 (en) | Process for quality assurance of a system | |
| DE102021202334A1 (en) | FILTERING OPERATIONAL SCENARIOS WHEN OPERATING A VEHICLE | |
| DE102023123114A1 (en) | Method and device for semantic segmentation and clutter detection | |
| DE102023121575A1 (en) | ELECTRONIC DEVICE, VEHICLE AND PROGRAM | |
| DE102017207658A1 (en) | A method of identifying a vehicle with an accessory tag, and an apparatus for performing the method | |
| DE102024108957B4 (en) | Method for operating a motor vehicle, computer program product, control unit and motor vehicle | |
| DE102021214552A1 (en) | Method for evaluating a trained deep neural network | |
| DE102018221093A1 (en) | Method for processing environmental information of a motor vehicle, computer program product and electronic information processing system | |
| DE102019208864A1 (en) | Detection system, working procedures and training procedures | |
| DE102024203543A1 (en) | Method for training a metric learning model |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R012 | Request for examination validly filed | ||
| R016 | Response to examination communication |