DFG-Projekt "Entwicklung realistischer Angriffsszenarien"

Entwicklung realistischer Angriffsszenarien bei der Zusammenführung personenbezogener Daten und Algorithmen zur Verhinderung solcher Angriffe

English Version below.

Die Bedeutung der Analyse vorhandener großer Datenbestände (Big Data) nimmt auch für die Sozialwissenschaften und die amtliche Statistik zu. Die Analyse solcher Datenbestände erfordert häufig die personenbezogene Zusammenführung mehrerer Datenbanken aus unterschiedlichen Quellen. Um dies ohne eine eindeutige Personenkennziffer durchführen zu können, werden in der Statistik und Informatik Record-Linkage-Verfahren verwendet. Um diese so einsetzen zu können, dass die europäischen Datenschutzauflagen unter den Bedingungen der föderalen und dezentralen Organisation des Datenschutzes in Deutschland erfüllt werden, sind besondere Maßnahmen erforderlich (privacy preserving record linkage).

Bisherige Ansätze besitzen kein überzeugendes Sicherheitskonzept, da kein formales Angriffsmodell existiert. Das Arbeitsprogramm dieses Vorhabens ist die Entwicklung solcher Angriffsmodelle und von Algorithmen um diese Angriffe zu erschweren oder vollkommen auszuschließen. Im Projekt sollen die Qualitätsanforderungen an solche Verfahren definiert und ein formales Sicherheitsmodell entwickelt werden. Die Analyse bestehender Vorschläge in Hinsicht auf das formale Sicherheitsmodell soll von der Entwicklung neuer Schutzmechanismen gefolgt werden. Der Antrag enthält die Beschreibung dreier bisher unveröffentlichter solcher Mechanismen. Alle Verfahren sollen mathematisch, durch Simulationen und anhand realer Datenbestände geprüft werden. Das Ziel des Projekts ist die Entwicklung von in Hinsicht auf realistische Angriffe kryptographisch sicheren Record-Linkage-Verfahren für große Datenbestände.   

 

Developing realistic attack models for privacy preserving record linkage and algorithms to prevent such attacks

 

 

Analyzing large scale data sets (big data) is gaining importance in the Social Sciences and Official Statistics. The analysis of such data often requires linking multiple data sets. In many countries, this linkage has to be done without a unique personal identification number. This process is called record linkage in statistics and computer science. Record linkage under the special restrictions given by European law and the federal and non-central organisation of data protection in Germany requires special techniques (privacy preserving record linkage). Previous approaches are not based on realistic attack models. The work program of this project is the development of such attack models and algorithms to prevent these attacks. The project will define quality requirements for privacy linkage and develop a formal security model. The analysis of existing proposals with regard to the formal security model will be followed by the development of new safeguards. The proposal describes three previously unpublished methods. Existing and newly developed procedures will be studied mathematically, with simulated and with real world data. The goal of the project is the development of cryptographically secure privacy preserving record linkage techniques for large data sets.