CN116305274A - 轨迹数据脱敏方法、装置、电子设备及可读存储介质 - Google Patents
轨迹数据脱敏方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN116305274A CN116305274A CN202310269288.1A CN202310269288A CN116305274A CN 116305274 A CN116305274 A CN 116305274A CN 202310269288 A CN202310269288 A CN 202310269288A CN 116305274 A CN116305274 A CN 116305274A
- Authority
- CN
- China
- Prior art keywords
- coordinate data
- data set
- sensitive
- coordinate
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Complex Calculations (AREA)
Abstract
本发明提供了一种轨迹数据脱敏方法、装置、电子设备及可读存储介质,涉及数据处理技术领域。通过获取源坐标数据集合,该源坐标数据集合表征驾驶轨迹且包括至少一个敏感坐标数据,敏感坐标数据带有数据采集时生成的敏感标记;接着基于预设的数据构建规则和敏感坐标数据的敏感标记,对源坐标数据集合进行脱敏处理,得到保留有驾驶轨迹的轨迹特征的目标脱敏数据集合。如此,既能够节省人力,还能提高脱敏效率。
Description
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种轨迹数据脱敏方法、装置、电子设备及可读存储介质。
背景技术
数据作为一种资源,它的普遍性、共享性、增值性、可处理性和多效用性,使其对于人类具有特别重要的意义。但是数据在存储、处理和交换过程中,都存在泄密或被截收、窃听、篡改和伪造的可能性。数据脱敏作为一项重要的数据安全防护手段,它可以有效地减少敏感数据在采集、传输、使用等环节中的暴露,进而降低敏感数据泄露的风险,确保数据安全且合规。
例如驾驶的轨迹数据或多或少会包含一些个人隐私数据或者禁止发布的敏感数据。而现有技术中,通常是人工查找轨迹数据中的敏感数据并进行数据替换或者直接删除来实现脱敏。但是这样极其耗费人力,并且处理效率极低。
发明内容
本发明的目的在于提供一种轨迹数据脱敏方法、装置、电子设备及可读存储介质,以改善现有技术存在的问题。
本发明的实施例可以这样实现:
第一方面,本发明提供一种轨迹数据脱敏方法,包括:
获取源坐标数据集合,所述源坐标数据集合表征驾驶轨迹,且包括至少一个敏感坐标数据,所述敏感坐标数据带有数据采集时生成的敏感标记;
基于预设的数据构建规则和所述敏感坐标数据的敏感标记,对所述源坐标数据集合进行脱敏处理,得到目标脱敏数据集合,所述目标脱敏数据集合保留有所述驾驶轨迹的轨迹特征。
在可选的实施方式中,所述基于预设的数据构建规则和所述敏感坐标数据的敏感标记,对所述源坐标数据集合进行脱敏处理,得到目标脱敏数据集合的步骤,包括:
对所述源坐标数据集合的每个坐标数据进行坐标转换以从大地坐标系转入笛卡尔坐标系,得到转换后的第一坐标数据集合;
对所述第一坐标数据集合进行去重处理,得到去重坐标数据集合;
基于每个所述敏感标记和所述数据构建规则,对所述去重坐标数据集合进行脱敏,得到至少一个所述目标脱敏数据集合。
在可选的实施方式中,在所述对所述第一坐标数据集合进行去重处理,得到去重坐标数据集合的步骤之前,还包括:
计算所述第一坐标数据集合的数学期望和方差。
在可选的实施方式中,所述对所述第一坐标数据集合进行去重处理,得到去重坐标数据集合的步骤,包括:
对所述第一坐标数据集合进行离散傅里叶变换,将连续信号的时域采样做一次加窗处理,得到离散的去重坐标数据集合。
在可选的实施方式中,所述基于每个所述敏感标记和所述数据构建规则,对所述去重坐标数据集合进行脱敏,得到至少一个所述目标脱敏数据集合的步骤,包括:
从所述去重坐标数据集合中查找所述敏感标记对应的敏感坐标数据,并将所述敏感坐标数据剔除,得到脱敏后的去重坐标数据集合;
基于所述数据构建规则和所述脱敏后的去重坐标数据集合,采用插值法构造至少一个第二坐标数据集合;其中,所述数据构建规则为所述第二坐标数据集合的数学期望和方差分别等于所述第一坐标数据集合的数学期望和方差;
将每个所述第二坐标数据集合均作为所述目标脱敏数据集合。
在可选的实施方式中,所述插值法为拉格朗日插值法或者样条插值法。
第二方面,本发明提供一种轨迹数据脱敏装置,包括:
数据获取模块,用于获取源坐标数据集合,所述源坐标数据集合表征驾驶轨迹,且包括至少一个敏感坐标数据,所述敏感坐标数据带有数据采集时生成的敏感标记;
数据处理模块,用于基于预设的数据构建规则和所述敏感坐标数据的敏感标记,对所述源坐标数据集合进行脱敏处理,得到目标脱敏数据集合,所述目标脱敏数据集合保留有所述驾驶轨迹的轨迹特征。
在可选的实施方式中,所述数据处理模块,具体用于:
对所述源坐标数据集合的每个坐标数据进行坐标转换以从大地坐标系转入笛卡尔坐标系,得到转换后的第一坐标数据集合;
对所述第一坐标数据集合进行去重处理,得到去重坐标数据集合;
基于每个所述敏感标记和所述数据构建规则,对所述去重坐标数据集合进行脱敏,得到至少一个所述目标脱敏数据集合。
第三方面,本发明提供一种电子设备,包括:存储器和处理器,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时所述处理器执行所述机器可读指令以实现如前述实施方式中任一项所述的轨迹数据脱敏方法。
第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现前述实施方式中任一项所述的轨迹数据脱敏方法。
与现有技术相比,本发明实施例提供了一种轨迹数据脱敏方法、装置、电子设备及可读存储介质,通过获取源坐标数据集合,该源坐标数据集合表征驾驶轨迹且包括至少一个敏感坐标数据,敏感坐标数据带有数据采集时生成的敏感标记;接着基于预设的数据构建规则和敏感坐标数据的敏感标记,对源坐标数据集合进行脱敏处理,得到保留有驾驶轨迹的轨迹特征的目标脱敏数据集合。如此,既能够节省人力,还能提高脱敏效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种电子设备的结构示意图。
图2为本发明实施例提供的一种轨迹数据脱敏方法的流程示意图之一。
图3为本发明实施例提供的一种轨迹数据脱敏方法的流程示意图之二。
图4为本发明实施例提供的一种数据处理过程示意图。
图5为本发明实施例提供的脱敏前后的轨迹对照示意图。
图6为本发明实施例提供的一种轨迹数据脱敏装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在不冲突的情况下,本发明的实施例中的特征可以相互结合。
本发明实施例提供一种轨迹数据脱敏方法,能够基于预设的数据构建规则和敏感坐标数据的敏感标记,对源坐标数据集合进行脱敏处理,得到保留有驾驶轨迹的轨迹特征的目标脱敏数据集合。如此,既能够节省人力,还能提高脱敏效率。以下通过实施例,并配合所附附图,进行详细说明。
请参见图1,图1为本发明实施例提供的一种电子设备的结构示意图。该电子设备100包括处理器110、存储器120和总线130,处理器110通过总线130与存储器120连接。
存储器120可用于存储软件程序以及模组,例如,如本发明实施例所提供的轨迹数据脱敏装置200对应的程序指令/模组。处理器110通过运行存储在存储器120内的软件程序以及模组,从而执行各种功能应用以及数据处理,如本发明实施例所提供的轨迹数据脱敏方法。
其中,存储器120可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),闪存存储器(Flash),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable ProgrammableRead-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable ProgrammableRead-Only Memory,EEPROM)等。
处理器110可以是一种集成电路芯片,具有信号处理能力。该处理器110可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选的,电子设备100可以是但不限于个人电脑、服务器、智能车等。
可以理解,图1所示的结构仅为示意,电子设备100还可以包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
请参考图2,图2为本发明实施例提供的一种轨迹数据脱敏方法的流程示意图,该方法的执行主体可以是上述电子设备,该方法包括以下步骤:
S100、获取源坐标数据集合。
在本实施例中,源坐标数据集合可以表征驾驶轨迹,且包括至少一个敏感坐标数据,每个敏感坐标数据可以带有数据采集时生成的敏感标记。
可以理解,源坐标数据集合可以包括若干个坐标数据,至少一个坐标数据为带有敏感标记的敏感坐标数据。源坐标数据集合中每个坐标数据可以包括由纬度和经度。
S200、基于预设的数据构建规则和敏感坐标数据的敏感标记,对源坐标数据集合进行脱敏处理,得到目标脱敏数据集合。
在本实施例中,目标脱敏数据集合保留有驾驶轨迹的轨迹特征,轨迹特征即为驾驶轨迹的形状特征。
本发明实施例提供的轨迹数据脱敏方法,通过获取源坐标数据集合,该源坐标数据集合表征驾驶轨迹且包括至少一个敏感坐标数据,敏感坐标数据带有数据采集时生成的敏感标记;接着基于预设的数据构建规则和敏感坐标数据的敏感标记,对源坐标数据集合进行脱敏处理,得到保留有驾驶轨迹的轨迹特征的目标脱敏数据集合。如此,既能够节省人力,还能提高脱敏效率。
在可选的实施方式中,为了保护数据,需要先对坐标数据进行坐标转换后在进行脱敏处理。对应的,请参见图3,上述步骤S200的子步骤可以包括S210~S240。
S210、对源坐标数据集合的每个坐标数据进行坐标转换以从大地坐标系转入笛卡尔坐标系,得到转换后的第一坐标数据集合。
可以理解,源坐标数据集合中每个坐标数据位于大地坐标系中,而第一坐标数据集合中每个坐标数据位于笛卡尔坐标系中。这样将常见的大地坐标数据转为笛卡尔坐标数据,能够一定程度上保护数据不被识别为具体的地点坐标。
S220、计算第一坐标数据集合的数学期望和方差。
S230、对第一坐标数据集合进行去重处理,得到去重坐标数据集合。
可选的示例中,驾驶轨迹中可能存在重复轨迹,去重处理可以将重复轨迹对应的坐标数据去掉,以避免数据冗余。S230的子步骤可以包括:
S231、对第一坐标数据集合进行离散傅里叶变换,将连续信号的时域采样做一次加窗处理,得到离散的去重坐标数据集合。
在本实施例中,对第一坐标数据集合进行离散傅里叶变换后,可能存在与重复轨迹对应的周期性变化的离散信号,加窗处理即可去除重复的周期性变化的离散信号。
S240、基于每个敏感标记和数据构建规则,对去重坐标数据集合进行脱敏,得到至少一个目标脱敏数据集合。
可选的示例中,S240的子步骤可以包括S241~S243:
S241、从去重坐标数据集合中查找敏感标记对应的敏感坐标数据,并将敏感坐标数据剔除,得到脱敏后的去重坐标数据集合。
S242、基于数据构建规则和脱敏后的去重坐标数据集合,采用插值法构造至少一个第二坐标数据集合。
在本实施例中,数据构建规则可以是第二坐标数据集合的数学期望和方差分别等于第一坐标数据集合的数学期望和方差。
可选的示例中,插值法可以采用拉格朗日插值法或者样条插值法。
S243、将每个第二坐标数据集合均作为目标脱敏数据集合。
满足数据构建规则的第二坐标数据集合能够保证保留有驾驶轨迹的轨迹特征,因此可以将第二坐标数据集合作为目标脱敏数据集合。
请参考图4,上述步骤S210~240中涉及的数据脱敏过程可以如图4所示。
结合图4,源坐标数据集合、第一坐标数据集合、去重坐标数据集合、脱敏后的去重坐标数据集合、第二坐标数据集合分别为图4中的集合A、集合B、集合B′、集合B″、集合C,本方案的数据处理过程如下:
对集合A进行坐标转换得到集合B,在对集合B进行傅里叶变换得到集合B′,接着剔除集合B′中的敏感坐标得到集合B″,最终利用插值法构建出集合C。该集合C的数学期望E(C)、方差D(C)分别等于集合B的数学期望E(B)、方差D(B)。
在图4的基础上,结合图5,图5为脱敏前后的轨迹对照示意图。对比图5中源坐标数据集合对应的驾驶轨迹S1与目标脱敏数据集合对应的驾驶轨迹S2,可以看出,S2保留了S1的轨迹特征,即轨迹形状。
如此,本方案可以从数据本身出发,采用离散傅里叶变换和数据插值的方式,先对坐标转换后的集合进行傅里叶变换,再剔除敏感坐标,最后通过插值构造出新的集合(即目标脱敏数据集合),该目标脱敏数据集合剔除了敏感坐标,并且在保留驾驶轨迹的轨迹特征的基础上,保护了数据的安全性,能够供作后续使用。以及目标脱敏数据集合具有不可逆性,即无法通过该新的集合逆推出源坐标数据集合。
为了便于说明本方案实施例,结合图4,以下给出一种具体示例。
假设集合A(源坐标数据集合)包含了总计62个坐标数据,两个坐标数据之间以逗号隔开,带有敏感标记的即为敏感坐标数据。集合A可以如下所示:
[(114.266434 30.527505),(114.266670 30.527325),(114.26692230.527145),(114.267185 30.527357),(114.267485 30.527671),(114.26760330.527829),(114.267759 30.528060),(114.267855 30.528175敏感(水总闸口)),(114.26807530.528078),(114.268274 30.527972),(114.26849930.528328),(114.26874030.528720),(114.269014 30.529118),(114.26959330.529977敏感(码头)),(114.26933030.530102),(114.269668 30.530629),(114.269990 30.531165),(114.27032330.531678),(114.266434 30.527505),(114.266670 30.527325),(114.26679330.527228),(114.266932 30.527145),(114.267179 30.527353),(114.26742130.527588),(114.267662 30.527907),(114.267855 30.528175敏感(水总闸口)),(114.268097 30.528060),(114.268274 30.527972),(114.268483 30.528300),(114.268805 30.528813),(114.269159 30.529330),(114.269405 30.529686),(114.269593 30.529977敏感(码头)),(114.269502 30.530023),(114.26934130.530107),(114.26968430.530647),(114.269899 30.530961),(114.27013030.531382),(114.27032330.531678),(114.266434 30.527505),(114.26661630.527371),(114.26676130.527256),(114.266932 30.527145),(114.26716830.527339),(114.26740530.527574),(114.267598 30.527787),(114.26770030.527953),(114.26785530.528175敏感(水总闸口)),(114.268080 30.528073),(114.26827930.527967),(114.268440 30.528231),(114.268633 30.528540),(114.26886930.528896),(114.269186 30.529358),(114.269405 30.529686),(114.26959330.529977敏感(码头)),(114.269513 30.530023),(114.26934130.530107),(114.269636 30.530550),(114.269883 30.530971),(114.27011430.531350),(114.270323 30.531678)]
对集合A的每个坐标数据进行坐标转换(从大地坐标系转入笛卡尔坐标系得到集合B(第一坐标数据集合),集合B可以如下所示:
[(3381781.020690023 813443.2639875237),(3381761.714707957813466.5010014758),(3381742.453308832 813491.2742572038),(3381766.697289668813515.8430988832),(3381802.3566504447813543.636129179),(3381820.2081693523813554.4570600989),(3381846.2615704113 813568.6914936386),(3381859.2829502556813577.5384511084),(3381849.137800718 813598.9724471516),(3381837.936062353813618.4192479695),(3381878.044853337813638.875966588),(3381922.1908421577813660.7528212012),(3381967.094247505 813685.7784357041),(3382063.974678638813738.6024436688),(3382077.1050741477 813712.950264751),(3382136.493725397813743.7044538299),(3382196.8360571135813772.8932013756),(3382254.6583380485813803.2116921693),(3381781.020690023 813443.2639875237),(3381761.714707957813466.5010014758),(3381751.2993173953 813478.622097058),(3381742.4811461284813492.2343561716),(3381766.236966449813515.2799041519),(3381792.9733558963813537.7584663709),(3381829.0230292333 813559.8707274897),(3381859.2829502556813577.5384511084),(3381847.202777053 813601.1425489266),(3381837.936062353813618.4192479695),(3381874.8949527126813637.429908662),(3381932.686054899813666.694131446),(3381991.0100302976 813699.0173864777),(3382031.1775360405813721.4896124864),(3382063.974678638 813738.6024436688),(3382068.8227724084813729.71773956),(3382077.690244655813713.9902513853),(3382138.5345963873813745.1826233624),(3382173.957851916 813764.8133066269),(3382221.292584894813785.6354943675),(3382254.6583380485 813803.2116921693),(3381781.020690023813443.2639875237), (3381766.666021605813461.1685731541),(3381754.3155776813475.4597508293),(3381742.4811461284 813492.2343561716),(3381764.6536748605813514.2688193796),(3381791.3761408543 813536.2673402147),(3381815.5362420906 813554.1120994114),(3381834.2304624673813563.3711202543),(3381859.2829502556 813577.5384511084),(3381848.597199923 813599.4685764181),(3381837.3954623323813618.9153787384),(3381867.122752053 813633.5235158161),(3381901.9299203474 813651.0590563683),(3381942.0694367695813672.5715977013),(3381994.1905859467 813701.5194931328),(3382031.1775360405813721.4896124864),(3382063.974678638813738.6024436688),(3382068.8534194157813730.773818465),(3382077.690244655 813713.9902513853),(3382127.6430676556813740.8865128392),(3382175.0223189276 813763.2450175718),(3382217.6990356008813784.2024133983),(3382254.6583380485813803.2116921693)]
接下来可以先计算得到集合B的数学期望E(B)、方差D(B)。然后对集合B进行离散傅里叶变换,将连续信号的时域采样做一次加窗处理,这样就得到有限长度的离散信号数据集合B′如下所示:
[(3381781.020690023 813443.2639875237),(3381761.714707957813466.5010014758),(3381742.453308832 813491.2742572038),(3381766.697289668813515.8430988832),(3381802.3566504447813543.636129179),(3381820.2081693523813554.4570600989),(3381846.2615704113 813568.6914936386),(3381859.2829502556813577.5384511084),(3381849.137800718 813598.9724471516),(3381837.936062353813618.4192479695),(3381878.044853337813638.875966588),(3381922.1908421577813660.7528212012),(3381967.094247505 813685.7784357041),(3382063.974678638813738.6024436688),(3382077.1050741477 813712.950264751),(3382136.493725397813743.7044538299),(3382196.8360571135813772.8932013756),(3382254.6583380485813803.2116921693)]
然后需要进行数据替换:在集合B′的基础上,剔除敏感坐标得到集合B″,然后基于集合B″利用插值法得到集合C且保证集合C的数学期望E(C)、方差D(C)分别等于集合B的数学期望E(B)、方差D(B),集合C可以如下所示:
[(813443.2639875237 3381781.020690023),(813466.50100147583381761.714707957),(813491.2742572038 3381742.453308832),(813515.84309888323381766.697289668),(813543.6361291793381802.3566504447),(813554.45706009893381820.2081693523),(813564.8011233893 3381837.9348752997),(813576.28137665733381833.050915622),(813590.3345896639 3381828.9075825433),(813615.7560100563381820.432086304),(813634.0035602873381867.136677474),(813651.05905636833381901.9299203474),(813666.7102195035 3381932.1315300474),(813684.76739692013381965.5109359445),(813696.122124282 3381984.8211118965),(813683.49898535283381992.668729379),(813680.54052032273382021.7754576323),(813696.7744000193382048.442104805),(813733.998210032 3382116.6763148573),(813756.43080504963382161.504730725),(813789.0846966497 3382224.944655625),(813803.21169216933382254.6583380485)]
因此,上述集合C即为集合A(源坐标数据集合)对应的目标脱敏数据集合。
需要说明的是,上述举例仅为示例,在此不做限定。且上述方法实施例中各个步骤的执行顺序不以附图所示为限制,各步骤的执行顺序以实际应用情况为准。
为了执行上述方法实施例及各个可能的实施方式中的相应步骤,下面分别给出一种轨迹数据脱敏装置的实现方式。
请参见图6,图6示出了本发明实施例提供的轨迹数据脱敏装置的结构示意图。该轨迹数据脱敏装置200包括:数据获取模块210和数据处理模块220。
数据获取模块210,用于获取源坐标数据集合,源坐标数据集合表征驾驶轨迹,且包括至少一个敏感坐标数据,敏感坐标数据带有数据采集时生成的敏感标记。
数据处理模块220,用于基于预设的数据构建规则和敏感坐标数据的敏感标记,对源坐标数据集合进行脱敏处理,得到目标脱敏数据集合,目标脱敏数据集合保留有驾驶轨迹的轨迹特征。
在可选的实施方式中,数据处理模块220,具体可以用于:对源坐标数据集合的每个坐标数据进行坐标转换以从大地坐标系转入笛卡尔坐标系,得到转换后的第一坐标数据集合;计算第一坐标数据集合的数学期望和方差;对第一坐标数据集合进行去重处理,得到去重坐标数据集合;基于每个敏感标记和数据构建规则,对去重坐标数据集合进行脱敏,得到至少一个目标脱敏数据集合。
在可选的实施方式中,数据处理模块220用于对第一坐标数据集合进行去重处理,得到去重坐标数据集合时,具体可以用于:对第一坐标数据集合进行离散傅里叶变换,将连续信号的时域采样做一次加窗处理,得到离散的去重坐标数据集合。
在可选的实施方式中,数据处理模块220用于基于每个敏感标记和数据构建规则,对去重坐标数据集合进行脱敏,得到至少一个目标脱敏数据集合时,具体可以用于:从去重坐标数据集合中查找敏感标记对应的敏感坐标数据,并将敏感坐标数据剔除,得到脱敏后的去重坐标数据集合;基于数据构建规则和脱敏后的去重坐标数据集合,采用插值法构造至少一个第二坐标数据集合;其中,数据构建规则为第二坐标数据集合的数学期望和方差分别等于第一坐标数据集合的数学期望和方差;将每个第二坐标数据集合均作为目标脱敏数据集合。
在可选的实施方式中,插值法为拉格朗日插值法或者样条插值法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的轨迹数据脱敏装置200的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时实现上述实施例揭示的轨迹数据脱敏方法。该计算机可读存储介质可以是但不限于:U盘、移动硬盘、ROM、RAM、PROM、EPROM、EEPROM、FLASH磁碟或者光盘等各种可以存储程序代码的介质。
综上,本发明实施例提供了一种轨迹数据脱敏方法、装置、电子设备及可读存储介质,通过获取源坐标数据集合,该源坐标数据集合表征驾驶轨迹且包括至少一个敏感坐标数据,敏感坐标数据带有数据采集时生成的敏感标记;接着基于预设的数据构建规则和敏感坐标数据的敏感标记,对源坐标数据集合进行脱敏处理,得到保留有驾驶轨迹的轨迹特征的目标脱敏数据集合。如此,既能够节省人力,还能提高脱敏效率。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种轨迹数据脱敏方法,其特征在于,包括:
获取源坐标数据集合,所述源坐标数据集合表征驾驶轨迹,且包括至少一个敏感坐标数据,所述敏感坐标数据带有数据采集时生成的敏感标记;
基于预设的数据构建规则和所述敏感坐标数据的敏感标记,对所述源坐标数据集合进行脱敏处理,得到目标脱敏数据集合,所述目标脱敏数据集合保留有所述驾驶轨迹的轨迹特征。
2.根据权利要求1所述的方法,其特征在于,所述基于预设的数据构建规则和所述敏感坐标数据的敏感标记,对所述源坐标数据集合进行脱敏处理,得到目标脱敏数据集合的步骤,包括:
对所述源坐标数据集合的每个坐标数据进行坐标转换以从大地坐标系转入笛卡尔坐标系,得到转换后的第一坐标数据集合;
对所述第一坐标数据集合进行去重处理,得到去重坐标数据集合;
基于每个所述敏感标记和所述数据构建规则,对所述去重坐标数据集合进行脱敏,得到至少一个所述目标脱敏数据集合。
3.根据权利要求2所述的方法,其特征在于,在所述对所述第一坐标数据集合进行去重处理,得到去重坐标数据集合的步骤之前,还包括:
计算所述第一坐标数据集合的数学期望和方差。
4.根据权利要求2所述的方法,其特征在于,所述对所述第一坐标数据集合进行去重处理,得到去重坐标数据集合的步骤,包括:
对所述第一坐标数据集合进行离散傅里叶变换,将连续信号的时域采样做一次加窗处理,得到离散的去重坐标数据集合。
5.根据权利要求3所述的方法,其特征在于,所述基于每个所述敏感标记和所述数据构建规则,对所述去重坐标数据集合进行脱敏,得到至少一个所述目标脱敏数据集合的步骤,包括:
从所述去重坐标数据集合中查找所述敏感标记对应的敏感坐标数据,并将所述敏感坐标数据剔除,得到脱敏后的去重坐标数据集合;
基于所述数据构建规则和所述脱敏后的去重坐标数据集合,采用插值法构造至少一个第二坐标数据集合;其中,所述数据构建规则为所述第二坐标数据集合的数学期望和方差分别等于所述第一坐标数据集合的数学期望和方差;
将每个所述第二坐标数据集合均作为所述目标脱敏数据集合。
6.根据权利要求5所述的方法,其特征在于,所述插值法为拉格朗日插值法或者样条插值法。
7.一种轨迹数据脱敏装置,其特征在于,包括:
数据获取模块,用于获取源坐标数据集合,所述源坐标数据集合表征驾驶轨迹,且包括至少一个敏感坐标数据,所述敏感坐标数据带有数据采集时生成的敏感标记;
数据处理模块,用于基于预设的数据构建规则和所述敏感坐标数据的敏感标记,对所述源坐标数据集合进行脱敏处理,得到目标脱敏数据集合,所述目标脱敏数据集合保留有所述驾驶轨迹的轨迹特征。
8.根据权利要求7所述的装置,其特征在于,所述数据处理模块,具体用于:
对所述源坐标数据集合的每个坐标数据进行坐标转换以从大地坐标系转入笛卡尔坐标系,得到转换后的第一坐标数据集合;
对所述第一坐标数据集合进行去重处理,得到去重坐标数据集合;
基于每个所述敏感标记和所述数据构建规则,对所述去重坐标数据集合进行脱敏,得到至少一个所述目标脱敏数据集合。
9.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时所述处理器执行所述机器可读指令以实现如权利要求1-6中任一项所述的轨迹数据脱敏方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6中任一项所述的轨迹数据脱敏方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202310269288.1A CN116305274A (zh) | 2023-03-17 | 2023-03-17 | 轨迹数据脱敏方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202310269288.1A CN116305274A (zh) | 2023-03-17 | 2023-03-17 | 轨迹数据脱敏方法、装置、电子设备及可读存储介质 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN116305274A true CN116305274A (zh) | 2023-06-23 |
Family
ID=86818270
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202310269288.1A Pending CN116305274A (zh) | 2023-03-17 | 2023-03-17 | 轨迹数据脱敏方法、装置、电子设备及可读存储介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN116305274A (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119150358A (zh) * | 2024-10-08 | 2024-12-17 | 岚图汽车科技有限公司 | 脱敏数据采集方法、装置、设备及存储介质 |
| CN119622758A (zh) * | 2024-11-18 | 2025-03-14 | 湖北亿咖通科技有限公司 | 车辆的敏感数据的脱敏方法和装置 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103235933A (zh) * | 2013-04-15 | 2013-08-07 | 东南大学 | 一种基于隐马尔科夫模型的车辆异常行为检测方法 |
| CN112612822A (zh) * | 2020-12-11 | 2021-04-06 | 中铁第四勘察设计院集团有限公司 | 一种北斗坐标时间序列的预测方法、装置、设备和存储介质 |
| CN115544570A (zh) * | 2022-10-13 | 2022-12-30 | 广州图灵科技有限公司 | 一种基于位置相关性的个性化时空数据隐私保护方法 |
-
2023
- 2023-03-17 CN CN202310269288.1A patent/CN116305274A/zh active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103235933A (zh) * | 2013-04-15 | 2013-08-07 | 东南大学 | 一种基于隐马尔科夫模型的车辆异常行为检测方法 |
| CN112612822A (zh) * | 2020-12-11 | 2021-04-06 | 中铁第四勘察设计院集团有限公司 | 一种北斗坐标时间序列的预测方法、装置、设备和存储介质 |
| CN115544570A (zh) * | 2022-10-13 | 2022-12-30 | 广州图灵科技有限公司 | 一种基于位置相关性的个性化时空数据隐私保护方法 |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119150358A (zh) * | 2024-10-08 | 2024-12-17 | 岚图汽车科技有限公司 | 脱敏数据采集方法、装置、设备及存储介质 |
| CN119622758A (zh) * | 2024-11-18 | 2025-03-14 | 湖北亿咖通科技有限公司 | 车辆的敏感数据的脱敏方法和装置 |
| CN119622758B (zh) * | 2024-11-18 | 2026-02-06 | 湖北亿咖通科技有限公司 | 车辆的敏感数据的脱敏方法和装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN116305274A (zh) | 轨迹数据脱敏方法、装置、电子设备及可读存储介质 | |
| US8627138B1 (en) | Data protection system and method | |
| CN107430628B (zh) | 具有直接数据传输机制的加速框架 | |
| US9544726B2 (en) | Adding location names using private frequent location data | |
| US9043076B2 (en) | Automating predictive maintenance for automobiles | |
| CN111737564B (zh) | 一种信息查询方法、装置、设备及介质 | |
| WO2021068567A1 (zh) | 区块链的区块分发方法、装置、计算机设备和存储介质 | |
| US11275835B2 (en) | Method of speeding up a full antivirus scan of files on a mobile device | |
| US20160203149A1 (en) | File scanning method and apparatus related application | |
| CN110990346A (zh) | 基于区块链的文件数据处理方法、装置、设备及存储介质 | |
| CN109829328A (zh) | 数据脱敏、逆脱敏方法及装置、存储介质、终端 | |
| WO2022247442A1 (zh) | 符号解析方法、装置、设备及存储介质 | |
| CN113434616B (zh) | 用于管理共享车辆的方法、设备、介质及程序产品 | |
| CN117992204A (zh) | 内存检测方法、装置、设备及存储介质 | |
| WO2019071968A1 (zh) | 薪资计算方法、应用服务器及计算机可读存储介质 | |
| WO2019071958A1 (zh) | 基于云计算的薪资计算方法、应用服务器及计算机可读存储介质 | |
| WO2024207821A1 (zh) | 地图数据管理方法、装置、终端设备及可读存储介质 | |
| JP2021500643A (ja) | 分散ロケーション・ベースの重複排除のパフォーマンスを向上させるための方法、コンピュータ・プログラム製品、および装置 | |
| CN111046242B (zh) | 数据处理方法、装置、设备及介质 | |
| CN116842282A (zh) | 轨迹数据处理方法、装置、电子设备及存储介质 | |
| CN109299613B (zh) | 数据库分区权限的设置方法和终端设备 | |
| WO2022252880A1 (zh) | 数据处理方法及其装置、系统、存储介质 | |
| US9191279B1 (en) | Systems and methods for data loss prevention | |
| CN111027811A (zh) | 基于难度系数的车辆工单管理和评价方法、装置、终端、介质 | |
| CN112069065B (zh) | 算法调试方法、电子设备及计算机可读存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |