A A A
| Sitemap | Kontakt | Impressum | Datenschutz
ETZ Logo VDE Verlag Logo

Harmonie in der Terminologie mit neuronalen Netzen

Oft werden Begriffe der funktionalen Sicherheit und der IT-Sicherheit unterschiedlich verstanden. Um Harmonisierung bemüht sich das Projekt Harbsafe von VDE/DKE und der TU Braunschweig (Bild: fotolia_ Feng Yu)

Oft werden Begriffe der funktionalen Sicherheit und der IT-Sicherheit unterschiedlich verstanden. Um Harmonisierung bemüht sich das Projekt Harbsafe von VDE/DKE und der TU Braunschweig (Bild: fotolia_ Feng Yu)

01 Ein Begriffseintrag aus der IEC 61508-4

01 Ein Begriffseintrag aus der IEC 61508-4

03 Screenshot des aktuellen Harbsafe-Assistenten

03 Screenshot des aktuellen Harbsafe-Assistenten

04 Einträge aus dem Themenbereich Gefährdungsereignisse mit semantischer Beziehung

04 Einträge aus dem Themenbereich Gefährdungsereignisse mit semantischer Beziehung

Trotz Normung werden grundlegende Begriffe der funktionalen Sicherheit und der IT-Sicherheit teilweise unterschiedlich verstanden – je nach Zielen und fachlichem Hintergrund der normenden Experten. Das kann in Normen zu inkonsistenten Mehrfachfestlegungen von Begriffen führen – ein Umstand, der nach zeitaufwendiger Harmonisierung ruft. Wie man den Harmonisierungsprozess mithilfe semantischer Technologien basierend auf neuronalen Netzen unterstützen und beschleunigen kann, erforschen VDE/DKE und TU Braunschweig im Projekt Harbsafe.

Möchte man die funktionale Sicherheit automatisierungstechnischer Systeme gewährleisten, muss man sich bei zunehmender Vernetzung Gedanken um ihre IT-Sicherheit machen. Schließlich kann deren Beeinträchtigung eine Beeinträchtigung der funktionalen Sicherheit nach sich ziehen. Die Konzepte zur Wahrung funktionaler Sicherheit und IT-Sicherheit sollten dementsprechend in vielen Anwendungen noch einmal neu unter die Lupe genommen werden – zum Beispiel für den Aufbau der Smart Grids, für die Industrie 4.0 oder für den autonomen Verkehr. Hier kommt die technische Normung ins Spiel: Experten mit unterschiedlichen Hintergründen legen sowohl auf internationaler als auch auf nationaler Ebene Anforderungen fest. Für die funktionale Sicherheit und die IT-Sicherheit existieren neben Normenreihen, die beide Themenbereiche gesondert behandeln (IEC 61508, IEC 62443), auch Dokumente, die ihren Zusammenhang beschreiben (VDE-AR-E 2802-10-1).
Inkonsistenzen genormter sicherheitsrelevanter Begriffe
Da verschiedene Normen aus unterschiedlicher Feder stammen und einen eigenen Entstehungshintergrund haben, unterscheiden sich die organisatorischen Rahmenbedingungen, aber auch Ziele und Vorkenntnisse der mitwirkenden Experten. Verschiedene Experten machen sich unterschiedliche Begriffe des fachlichen Gegenstands – insbesondere wenn dieser abstrakt ist. Für fachliche Verständigung ist es unerlässlich, einzelne Gegenstände eindeutig zu definieren und eine einzige anerkannte Benennung zu verwenden. Dieser Teilaspekt der technischen Normung wird als Terminologienormung bezeichnet. Hierbei geht es nicht nur um die Festlegung von Benennungen für Begriffe, sondern auch um die Begriffe selbst, also um unsere Vorstellungen von Gegenständen. Begriffe sind dadurch bestimmt, wie wir sie durch wesentliche Merkmale und Beziehungen von anderen abgrenzen. In Normen werden Begriffe mittels einer Definition abgegrenzt und zusammen mit Benennungen als Begriffseinträge angegeben (Bild 1). Normungsorganisationen bieten ihre Terminologiebestände auch online an, zum Beispiel im DIN-Terminologieportal, in der ISO Online Browsing Platform oder im IEV-Wörterbuch.
Unterschiede bei der Begriffsbildung machen sich in Normen bemerkbar, da Begriffe oft mehrfach definiert sind. Beispielsweise wurden die Ausdrücke „risk“ 178 mal, „safety“ 57 mal und „security“ 50 mal in allen ISO/IEC-Normen definiert. Viele davon sind keine bloßen Wiederholungen, sondern mehr oder weniger ähnlich und können auch inkonsistent sein (Bild 2).
Bei Querschnittsthemen, wie funktionaler Sicherheit und IT-Sicherheit, ist das nicht verwunderlich, da sie an vielen Stellen relevant sind. Es gilt also zu erkennen, wo Normen und Normungsbedarfe konvergieren. Um dies organisatorisch zu lösen, werden in der technischen Normung Lenkungs- und Gemeinschaftsarbeitskreise eingerichtet, die einzelne Organisationseinheiten und Organisationen vernetzen. Diese arbeiten meist aber nicht auf der Ebene einzelner Begriffe.
Assistierte Harmonisierung genormter Begriffseinträge
Um Fachgegenstände eindeutig festzulegen, muss man sie nicht nur definieren, sondern Begriffseinträge mit unterschiedlicher Herkunft ggf. harmonisieren. Dafür bedarf es eines guten Überblicks, der durch Begriffssysteme sowie den Vergleich ihrer internen Beziehungen, Unterscheidungskriterien und Merkmale erreicht werden kann (ISO 860:2007-11). Dies dient der Identifikation von Dubletten (Einträge für denselben Begriff) sowie von Divergenzen und Inkonsistenzen zwischen inhaltlich verwandten Einträgen. Diese sind – wo möglich – zu bereinigen, sodass aus unterschiedlichen Begriffssystemen ein konsolidiertes (d. h. redundanzfreies und konsistentes) Begriffssystem hervorgeht. Allein wegen des Vergleichs der Begriffsstruktur ist die Harmonisierung eine zeitaufwendige Aufgabe, die dadurch erschwert wird, dass Einträge in Normen Merkmale, Beziehungen und Unterscheidungskriterien nicht immer explizit machen. Deren Rekonstruktion kann darüber hinaus auch durch lexikalische und syntaktische Varianz erschwert werden. Für die Gewinnung des notwendigen Überblicks wäre ein Hilfsmittel wünschenswert, das das Auffinden von Dubletten und verwandten Einträgen beschleunigt. Eine entsprechende Lösung entwickeln derzeit VDE/DKE und TU Braunschweig im Projekt Harbsafe (Bild 3).
Um den Eintragsbestand zu strukturieren und Inkonsistenzen zu identifizieren wird für jeden Begriffseintrag einer Norm mithilfe eines neuronalen Netzes eine semantische Repräsentation, ein sogenanntes „Embedding“, erstellt. Die Einträge werden so trotz syntaktischer und lexikalischer Unterschiede vergleichbar. Mithilfe der Embeddings lassen sich Dubletten durch den Harbsafe-Assistenten also auch dann ermitteln, wenn sie einen Begriff nicht wortwörtlich identisch definieren oder benennen.
Gute Beispiele für nicht-identische Benennung sind die Einträge 3.1.47 aus der IEC 62443-3-3 sowie 3.2.117 aus der IEC TS 62443-1-1. Sie sind zwar identisch definiert: „grouping of logical or physical assets that share common security requirements“, werden jedoch unter unterschiedlichen Benennungen geführt – „zone“ und „security zone“. Im Rahmen einer begriffsorientierten Terminologiemodellierung (wie sie für die Normung vorgesehen ist), sollte hier nur ein Eintrag vorliegen. Ein Beispiel für Dubletten mit nicht-identischer Definition sind dagegen die Einträge 3.1.19 aus der IEC 62443-2-4 + AMD1 sowie 3.1.39 aus derIEC 62443-3-3, die beide unter der Benennung „service provider“ geführt werden. Die Definitionen lauten dabei „individual or organization (internal or external organization, manufacturer, etc.) that provides a specific support service and associated supplies in accordance with an agreement with the asset owner“ beziehungsweise „organization (internal or external organization, manufacturer, etc.) that has agreed to undertake responsibility for providing a given support service and obtaining, when specified, supplies in accordance with an agreement“. Obwohl die Definitionen unterschiedlich formuliert sind, beschreiben sie annähernd denselben Begriff. Auch hier ist also eine Harmonisierung nach dem Prinzip „ein Begriff, ein Eintrag“ notwendig.
Auf Grundlage der Embeddings werden die Einträge zueinander in Beziehung gesetzt. Zu jedem Eintrag lassen sich neben Dubletten auch Einträge zu inhaltlich verwandten Begriffen identifizieren (vgl. „Similarity Ranking“ in Bild 3). Über die Ähnlichkeit ihrer Embeddings können so auch Eintragsgruppen zusammengestellt werden, die die thematischen Überlappungen der Normen verdeutlichen. Die verdeutlicht Bild 4 für Termini wie „hazardous event“, „harmful event“, „security incident“, „security violation“ oder „threat“, die aus unterschiedlichen Normen und Normungsdokumenten stammen. Die Gruppierung ist eine effiziente Methode zur semantischen Strukturierung eines heterogenen Terminologiebestands, die für die weitere Harmonisierung der Einträge notwendig ist.
Im Projekt Harbsafe sollen weitere Funktionen zur Harmonisierungsassistenz realisiert werden. (no)
Susanne Arndt, M. A. ist wissenschaftliche Mitarbeiterin an der Technischen Universität Braunschweig. sarndt@tu-bs.de
Dieter Schnäpp, M. A. ist wissenschaftlicher Mitarbeiter an der Technischen Universität Braunschweig. d.schnaepp@tu-bs.de
Dipl.-Ing. (FH) Sven Müller M. A., M. Sc. ist Projektmanager bei der DKE Deutsche Kommission Elektrotechnik Elektronik Informationstechnik in DIN und VDE in Frankfurt/M. sven.mueller@vde.com
Prof. Peter Bernard Ladkin ist Geschäftsführer der Causalis Ingenieur GmbH in Bielefeld. ladkin@causalis.com