Book: Semantische Datenintelligenz im Einsatz

© 2021

Semantische Datenintelligenz im Einsatz

Editors (view affiliations)

Börteçin Ege
Adrian Paschke

  • Mit zahlreichen Beispielen, geschrieben von verschiedenen Autoren, aus der Industrie
  • Zeigt Anwendungen in Künstlicher Intelligenz und Arbeit 4.0
  • Erläutert semantische Datenintelligenz in unterschiedlichen Einsatzgebieten

Semantische Technologien haben mit der Entwicklung von datenbasierten Systemen wie Neuronale Netze, Deep Learning und Machine Learning ihre Bedeutung nicht verloren, sondern werden als effiziente wissensbasierte Systeme immer wichtiger.

Denn intelligente Systeme der Zukunft müssen nicht nur in der Lage sein zu sagen, was sie entschieden haben, sondern auch wie sie zu dieser Entscheidung gekommen sind. Solche Systeme sind jedoch nur mit Hilfe von wissensbasierten Systemen auf der Grundlage von semantischen Technologien erreichbar.

Heute reichen die Anwendungen von semantischen Systemen von der semantischen Suche, Knowledge Graphs, Chatbots, NLP, in der Medizin bis zur Telekommunikation, Verwaltung und Robotik. Semantische Technologien werden spätestens mit dem Voranschreiten des Internet of Things (IoT) und Industrie 4.0 Anwendungen allgegenwärtig sein. Dies ist unumgänglich, denn ohne sie ist auch die Interoperabilität unter Maschinen und insbesondere unter Roboter für eine intelligente Zusammenarbeit und Produktion nicht so einfach umsetzbar. Dafür gibt es bereits heute zahlreiche Beispiele aus der Industrie.

Walter Diggelmann erklärt in Kapitel 11,

wie das Konzept des semantischen Fingerprints als Lösung für diese Herausforderungen eingesetzt werden kann. Der semantische Fingerprint basiert auf der Erkenntnis der intrinsischen oder inhärenten Semantik. Das ist die Semantik oder Botschaft eines Texts, wenn er nicht gelesen wird. Der semantische Fingerprint kann darüber hinaus als Grundlage für sämtliche weiteren linguistischen und statistischen Analysen eingesetzt werden.  

LINK zum Verlag

Walter Diggelmann explains in Chapter 11 how the concept of semantic fingerprinting can be used as a solution to these challenges. The semantic fingerprint is based on the recognition of intrinsic or inherent semantics. This is the semantics or message of a text when it is not being read. Furthermore, the semantic fingerprint can be used as a basis for all other linguistic and statistical analyses. (The book is currently only in German language available)


Fragen an Walt Diggelmann zum Thema:
Semantische Daten Intelligenz

Soeben ist das neue Buch: «Semantische Daten Intelligenz im Einsatz» herausgekommen. Sie haben das Kapitel 11 im Buch beigesteuert. Worum geht es?

Es geht im Grundsatz um das Thema, wie Maschinen «Systeme, Roboter, Software, Automaten etc.», Botschaften inhaltlich verstehen können und welche Herausforderungen zu beachten sind.

Was für grundlegende Herausforderungen stellen sich bei der Textanalyse mittels ML oder AI? (ML= Maschine Learning / AI = Artificial Intelligence)

Die eine grosse Herausforderung ist, dass der Sender (Verfasser / Autor) einer Botschaft, diese auf der Basis seines persönlichen Wissenshorizonts verfasst. Das bedeutet, dass jeder Empfänger und Leser, dieser Botschaft, über einen gleichen oder einen ähnlichen Wissenshorizont verfügen muss, damit er die Botschaft verstehen kann.

Können Sie das vielleicht näher erklären.

Gerne zwei Beispiele:

  1. Wenn die Botschaft mittels eines Wortschatzes verfasst ist, der dem Empfänger gänzlich oder weitgehend unbekannt ist, wird er den Text und damit die Botschaft nur teilweise oder gar nicht verstehen können.
  2. Wenn die Botschaft in einer dem Empfänger unbekannten Sprache verfasst ist, kann er gar nichts verstehen.

Natürlich umfasst der Wissenshorizont noch viele weitere Faktoren, aber das sind zwei anschauliche Beispiele.

Was hat das jetzt mit ML & AI zu tun?

Die Maschine, welche eine Botschaft verstehen soll, muss demnach mit einem Wissenshorizont ausgestattet und angelernt werden. Dabei muss sichergestellt sein, dass der korrekte Wissenshorizont verwendet wird. Klingt einfach, ist es aber nicht. Denn die Frage stellt sich: wer bestimmt und kontrolliert den Wissenshorizont?

Ich verstehe und merke, wohin das alles führt. Sie wollen damit erklären, dass Maschinen wie Menschen auch nur das können, was sie gelernt haben.

Genau, aber es kommt noch komplexer! Wir müssen auch noch über geprägte Inhalte sprechen. 

Was ist das?

Das sind Botschaften, welche gezielt geprägt, also tendenziös verfasst sind. Man könnte sagen, dass die Botschaften nicht neutral oder komplett den Tatsachen entsprechen, sondern politisch, emotional, oder aus anderen Motiven übertrieben oder dramatisiert sind, bis hin zu leicht verfälscht oder gar als Fake News (Lügen) bezeichnet werden müssen.

Das bedeutet, unsere Maschine muss nicht nur den Wissenshorizont haben, um eine Botschaft generisch korrekt zu verstehen, die Maschine muss auch noch einordnen können, ob der Inhalt neutral oder geprägt sein könnte.

Denn nur wenn die Maschine die Botschaft korrekt verstehen kann, kann sie darauf aufbauend korrekte Entscheidungen für eine nachfolgende Aktivität fällen, wie z.B. einen Alarm auslösen, eine Aktion starten oder aber auch einfach nichts tun, etc....

Ich verstehe, ML ist also viel mehr als nur ein bisschen Text auswerten!

Genau, wenn wir über AI sprechen, dann müssen ganz viele kleine Bausteine passen, damit sich eine Maschine «menschenartig» verhalten kann. Denn wenn das Ziel ist, dass sich eine Machine in «menschliche» Abläufe eingliedern soll, dann muss sie sich ebenbürtig verhalten können.

Denken Sie dabei nicht nur an Textanalyse, das Gleiche gilt für autonomes Fahren, Cyberkriminalitäts-Abwehr, Robotersteuerungen, alles was mit ML & AI in Berührung ist. Denn in all diesen Systemen werden technische Daten, Texte sowie Bilddaten (Botschaften) ausgetauscht, welche blitzartig richtig interpretiert werden müssen.

OK - und was hat das alles jetzt mit dem Wissenshorizont zu tun?

Stellen Sie sich vor, ein Ausländer aus einem sehr unterschiedlichen Kulturkreis kommt in Ihr Land. Er kann die Sprache nicht und er kennt unsere Kultur, also unsere sozialen Strukturen und unsere sozialen Verhaltens-Eigenheiten nicht.

Dann gibt es Schwierigkeiten!

Genau dann passiert genau das, was überall passiert. Der Ausländer fällt negativ auf. Er wird als minderwertig und als dumm betrachtet, nur weil er uns nicht verstehen kann, weil sein Wissenshorizont keine Überlappung mit unserem hat. – Aus seiner Sicht sind wir dumm und ignorant. Der Ausländer versteht uns tatsächlich und faktisch nicht.

Wobei wir gar nicht so weit suchen müssen, lassen sie einfach Rechte, Bürgerliche und Linke zusammen mit grünen Politikern aufeinandertreffen. Dann kommt man sich auch so vor, wie wenn alle aus einem entfernten Kulturkreis ohne Überlappung stammen würden.

Unsere Politiker könnten sich verstehen, wollen aber nicht. Sie haben eine stark geprägte Meinung und argumentieren durch eine politisch gefärbte Brille.

Wo liegt dann der Vorteil, Maschinen einzusetzen, wenn sie uns gar nicht überlegen sind?

Es gibt tatsächlich viele Bereiche, in denen uns Maschinen sehr überlegen sind. Wenn es um das Vergleichen geht, schnell Millionen an Daten in einer bestimmten und validierten Art zu verarbeiten, dann sind Maschinen unschlagbar wie auch bei der Suche nach Mustern, bestimmten Daten oder Kombinationen etc.

Wir haben bei ai-one den semantischen Fingerprint entwickelt. Das ist ein generischer Abdruck der inhärenten Aussage der Botschaft eines Textes, überführt in einen nummerischen Vektorraum.

Das verstehe ich jetzt noch nicht.

Stellen Sie sich einen Text vor, der auf dem Tisch liegt, aber niemand liest den Text. Hat der Text trotzdem eine Botschaft?

Ich vermute Ja?

Wir sagen auch Ja! Die inhärente Semantik ist die Botschaft, sogar wenn sie nicht gelesen und von einem Menschen interpretiert wird.

Die Worte sind gemäss der Grammatik einer Sprache platziert. Ein überlappender Wissenshorizont erkennt sofort die Botschaft, weil er die Worte und deren Struktur wie sie platziert sind, erkennt. Der Wissenshorizont kann sofort ähnliche Texte und Botschaften zeigen. Damit kann ich die Worte und deren Bedeutung im Einzelnen als auch die Bedeutung in den Sätzen verstehen.

Ich verstehe, der semantische Fingerprint hilft der Maschine, Botschaften besser und schneller zu verstehen, in dem er hilft, den Wissenshorizont überlappend zu gestalten? Ist das so korrekt formuliert?

Ja, so kann man das sagen.

Der semantische Fingerprint überführt die inhärente Botschaft automatisch in einen berechenbaren Vektorraum. Dadurch können Millionen ähnlicher Botschaften blitzschnell und unvoreingenommen verglichen werden, um so einen gemeinsamen Wissenshorizont zu erzeugen. Darüber hinaus arbeitet der semantische Fingerprint mit der generisch vorhandenen Botschaft, ohne Interpretation oder Gewichtung der Botschaft im ersten Schritt.

Damit ist gewährleistet, dass inhaltlich ähnliche Botschaften zum Original-Text vom Sender und nicht zu meiner Beurteilung oder Auswertung und Interpretation als Empfänger gefunden werden.

Alles klar, jetzt weiss ich, warum in der Kommunikation oftmals grosse Missverständnisse entstehen können. Die ai-one™ Technologie mit der Applikation BrainDogs™ hilft, Missverständnisse aufzulösen. 

Nicht nur das, wir sagen in unserem 10 Sekunden Werbespot:

>> ai-one™ gibt Antworten auf Fragen, welche noch gar nicht gestellt wurden. <<

© ai-one | wd | 25. September 2021


Questions for Walt Diggelmann on the topic:
Semantic Data Intelligence

The new book: «Semantic Data Intelligence im Einsatz» has just come out. You contributed chapter 11 in the book. What is it about?

It’s basically about the topic of how machines «systems, robots, software, automata, etc.», can understand messages in terms of content and what challenges need to be considered.

What are the basic challenges of text analysis using ML or AI? (ML= Machine Learning / AI = Artificial Intelligence).

The one big challenge is that the sender (writer / author) of a message, composes it based on his personal knowledge horizon. This means that every recipient and reader of this message must have the same or a similar knowledge horizon to understand the message.

Can you perhaps explain this in more detail?

Gladly two examples:

  1. If the message is written by means of a vocabulary that is completely or largely unknown to the recipient, he will be able to understand the text and thus the message only partially or not at all.
  2. If the message is written in a language unknown to the recipient, he will not be able to understand anything at all.

Of course, the knowledge horizon includes many more factors, but these are two illustrative examples.

What does this have to do with ML & AI?

The machine, which is to understand a message, must therefore be equipped with a knowledge horizon and trained. It must be ensured that the correct knowledge horizon is used. Sounds simple, but it is not. Because the question arises: who determines and controls the knowledge horizon?

I understand and realize where this is all leading. You want to explain that machines, like humans, can also only do what they have learned.

Exactly, but it comes still more complex! We also still must talk about imprinted content.

What is that?

These are messages, which are coined purposefully, thus tendentiously written. You could say that the messages do not correspond neutrally or completely to the facts, but are exaggerated or dramatized politically, emotionally, or for other motives, up to slightly distorted or even must be called fake news (lies).

This means that our machine must not only have the knowledge horizon to understand a message generically correctly, but the machine must also be able to classify whether the content could be neutral or coined.

Because only if the machine can understand the message correctly, it can make correct decisions based on it for a consequential activity, such as triggering an alarm, starting an action, or just doing nothing, etc....

I see, so ML is much more than just evaluating some text!

Exactly, when we talk about AI, a whole lot of little building blocks must fit for a machine to behave “human-like”. Because if the goal is for a machine to integrate itself into “human” processes, then it must be able to behave like a human.

Don’t just think of text analytics, the same goes for autonomous driving, cybercrime defense, robotic controls, anything that is in touch with ML & AI. Because in all these systems technical data, texts as well as image data (messages) are exchanged, which must be interpreted correctly in a flash.

OK, - and what does all this have to do with the knowledge horizon now?

Imagine that a foreigner from a very different cultural background comes to your country. He does not know the language and he does not know our culture, thus our social structures and our social behavior peculiarities.

Then there are difficulties!

Exactly then happens exactly, what happens everywhere. The foreigner stands out negatively. He is considered as inferior and as stupid, only because he cannot understand us, because his knowledge horizon has no overlap with ours. – From his point of view, we are stupid and ignorant. The foreigner actually and factually does not understand us.

Whereby we do not have to look so far, let them simply right-wingers, commoners, and left-wingers together with green politicians meet. Then one feels also as if all would come from a distant culture circle without overlapping.

Our politicians could understand each other, but they don’t want to. They have a strongly formed opinion and argue through politically colored glasses.

Where, then, is the advantage of using machines if they are not superior to us at all?

There are many areas where machines are very superior to us. When it comes to comparing, quickly processing millions of pieces of data in a specific and validated way, machines are unbeatable. When it comes to searching for patterns, specific data, or combinations, etc., machines are unbeatable.

At ai-one, we have developed the semantic fingerprint. This is a generic imprint of the inherent message of a text. Converted into a numerical vector space.

I don’t understand this yet.

Imagine a text lying on the table, but nobody reads the text. Does the text still have a message?

I suppose, yes?

We also say yes! The inherent semantics is the message, if it is not read and interpreted by a human being.

The words are placed according to the grammar of a language. An overlapping knowledge horizon immediately recognizes the message because it recognizes the words and their structure as they are placed. The knowledge horizon can immediately show similar texts and messages. Thus, I can understand the words and their meaning in detail as well as the meaning in the sentences.

I understand, the semantic fingerprint helps the machine to understand messages better and faster, in that it helps to overlap the knowledge horizon? Is that the correct way to put it?

Yes, it can be put that way.

The semantic fingerprint automatically converts the inherent message into a computable vector space. This allows millions of similar messages to be compared in a lightning-fast, unbiased manner to create a common knowledge horizon. Furthermore, the semantic fingerprint works with the generic existing message, without interpretation or weighting of the message in the first step.

This ensures that messages similar in content are found to the original text from the sender and not to my judgment or evaluation and interpretation as the receiver.

All right, now I know why big misunderstandings can often arise in communication. The ai-one™ technology with the BrainDogs™ application helps resolve misunderstandings. 

Not only that, but we also say in our 10 second commercial:

>> ai-one™ provides answers to questions that have not yet been asked. <<

© ai-one | wd | 25. September 2021


Download 

Fragen an Walt Diggelmann zum Thema:

FAKE-NEWS & INFLUENCER: IN

Sie sprechen im Buch: Semantische Systeme im Einsatz, u.a. über Fake News, was hat das mit Influencer: in zu tun?

Influencer: Innen, welche Fake-News als grosse Realität verbreiten, um ein bestimmtes politisches Ziel zu erreichen, können gefährlich für eine Demokratie sein!

Wie meinen Sie das genau?

Wir haben in den anderen Artikeln darüber gesprochen, dass das Spektrum bei Fake-News von tendenziös über übertrieben bis zu klaren Lügen reicht.

Egal ob jemand eine Mehrheit für oder gegen eine politische Partei, eine einzelne Person, oder eine Sache gewinnen möchte, ist es leider zur Normalität geworden, Fake-News oder sehr geprägte und tendenziöse Informationen einzusetzen, wenn man glaubt, dass das der eigenen Sache dient.

Was haben Influencer: Innen damit zu tun?

Influencer: Innen sind bekanntlich Personen, welche andere Personen mittels der sozialen Medien beeinflussen. Dabei kann es um Meinungen und Ansichten gehen oder um Produkte und Dinge. In jedem Fall geht es darum, möglichst viele Menschen in eine bestimmte Richtung zu überzeugen.

Was ist die Motivation der Influencer. Innen?

Viele Influencer: Innen handeln aus tiefer Überzeugung, und realitätsbezogen, andere einfach nur für Geld. Zusätzlich kann es sein, dass hinter einem Influencer keine Person steht, sondern ein sogenannter Troll, das ist eine «Maschine» - ein Programm, manuell oder durch künstliche Intelligenz gesteuert. Genau, und da beginnt das Problem. Influencer vermitteln persönliches Vertrauen, man ist geneigt ihnen zu glauben, ohne die Aussagen nachzuprüfen.

Der gezielte Einsatz «Missbrauch» von Influencer. Innen ist eine grosse Gefahr für die Demokratie.

Oftmals sind Influencer in geschlossenen Kreisen aktiv. Das verhindert, dass gegenteilige Meinungen in einem offenen Diskurs besprochen werden können. Zudem wird die Herkunft der Basis Informationen verschleiert, so dass nichts nachgeprüft oder nur sehr aufwendig nachgeprüft werden kann.

Man muss etwas nur oft genug wiederholen, schon wird es für einzelne Personen zur Wahrheit.

Ja genau, früher, also vor 50 oder 100 und mehr Jahren war es noch so, dass Zeitungen sehr gewissenhaft recherchiert hatten. Falschmeldungen waren selten. Was in der Zeitung stand, konnte man in der Regel als Fakten klassifizieren. Das ist heute nicht mehr so, weil nur noch hinter 30% der Artikel ein Mensch steht. 70% sind automatisch zusammen- «gestohlen» und werden oftmals unkontrolliert oder nicht verifiziert 1:1 wiedergegeben, oder auch vollautomatisch umgeschrieben und aufbereitet, was die Artikel eher verschlimmbessert. Das hat nichts mehr mit Journalismus auf ethischen Grundsätzen zu tun!

OK, kommen wir zum PUNKT

Wenn es um die Meinungsbildung beim Menschen geht, kann man feststellen, dass es eine 20-30-50-Regel gibt:

Was bedeutet die 20-30-50 Regel 

Geht es zum Beispiel um eine Abstimmung zu einem Sachthema, stellt man fest, dass man die Meinungen von Beginn weg immer in drei Gruppen aufteilen kann.

Die drei Positionen sind:

  • JA-Position
  • Nein-Position
  • Unentschlossen-Position

Wenn es um eine Entscheidung geht, haben diejenigen Personen, welche sich schon mit dem Thema befasst haben, oder vom Thema direkt betroffen sind, bereits eine klare Meinung und Position. Alle Personen, welche noch nicht betroffen sind, müssen sich noch eine Meinung bilden und sind unentschlossen.

Schaut man sich die vielen öffentlich zugänglichen Statistiken und Wahl Auswertungen oder Experten Meinungen an, dann kann man zu folgendem stark vereinfachtem Schluss kommen:

ca. 50% Der Menschen bilden eine Mehrheitsmeinung. Die Meinung der Mehrheit ist in der Regel nicht sehr differenziert und einfach nur träge. Oftmals will die Mehrheit einfach nichts ändern. Sind also traditionell auf der konservativen «Nein»-Position. Nennen wir diese Menge die: TrägeMenge

ca. 30% Der Menschen haben eine unentschlossene Meinung, welche auf «JA» oder «NEIN» kippen kann. Oftmals hat diese Gruppe eine Wechselmeinung, d.h. sie wechseln unberechenbar bei vermeintlich gleichen Sachthemen zwischen der «JA» und «NEIN» Position. Nennen wir diese Menge: WechselMenge

ca. 20% Der Menschen haben immer eine Minderheits-Meinung. Egal bei welchem Thema. Nennen wie diese Menge: MinderheitsMenge

Die Prozentangaben sind nicht sakrosankt, jede Gruppe kann auch 5%-10% mehr oder weniger Anteil haben, das variiert von Thema zu Thema.

OK, verstanden, was bedeutet das jetzt?

 

Vereinfacht betrachtet haben wir uns mit 3 Gruppen zu befassen. Die Frage ist, auf welche Gruppe soll man sich fokussieren, um eine gesicherte Mehrheit zu bekommen.

Gibt es die richtige Gruppe?

Das ist schwierig zu beantworten. Das hat vor allem damit zu tun, dass weltweit Parteien begonnen haben, Wahlergebnisse immer stärker in Frage zu stellen, wenn sie nicht zu ihren Gunsten ausfallen. Fake-News ist dabei wohl der berühmteste Terminus, welcher neu eingeführt wurde, um seinen politischen Unmut und die Diskreditierung eines Wahlergebnisses kundzutun.

Diese schädliche Tendenz hat dazu geführt, dass Themen viel emotionaler und persönlicher bekämpft werden. Positionen werden sehr emotional verteidigt und die Diskussionen sind nicht mehr sachlich, sondern privat und verletzend geführt.

Welchen Einfluss hat das auf die Überzeugungs-Strategie?

Der Politische Diskurs findet nicht mehr statt, es herrschen nur noch vorgefertigte Überzeugungen, welche nicht mehr umzustossen sind. Das kommt u.a. davon, dass viele politische Besprechungen und Diskussionen nicht mehr öffentlich, sondern in geschlossenen Gruppen von Sozialen Medien geführt werden. Die Teilnehmenden werden dabei betriebsblind. Sie folgen bedingungslos und undifferenziert ihren vertrauten Influencer: Innen.

Das führt dazu, dass viele Menschen eine sehr starre und bisweilen ignorante Haltung annehmen. Obwohl sich von sich behaupten, tolerant zu sein und viel Toleranz von «den Anderen» einfordern, sind sie selbst alles andere als tolerant. 

Bei welchen Themen schlägt das am meisten an?

Vor Covid-19 haben vor allem Religion und Politik stark polarisiert und beeinflusst. Heute kommt das Thema *Gesundheit & Impfen* mit dazu.

Gerade bei Covid-19 fallen viele Personen auf Fake-News herein. Politische Parteien wollen Vorteile aus der Covid-19 Affäre ziehen und nutzen Fake-News, tendenziöse Berichte und stark verblendete Sichtweisen, um bestimmte politische Positionen kundzutun, und möglichste viele Personen zu beeinflussen.

Es fällt auf, dass solche extremen Überzeugungs-Positionen eher bei der Minderheits-Menge vorkommen.

Auf welche Meinungsgruppe sollte man sich nun konzentrieren?

Ich würde das so formulieren:

TrägeMenge

Sicherstellen: Dass die TrägeMenge bleibt und nicht zu der Minderheit abwandert

WechselMenge         

Gewinnen der Menge der Unentschlossenen. Das muss das Hauptziel sein. Damit können Verluste bei der TrägenMenge kompensiert werden, sowie Mehrheiten geschaffen werden.  

MinderheitsMenge  

Vergessen, in der Regel ist es illusorisch, die 20% Minderheit von einer anderen Position zu überzeugen. Diese Energie kann man sich sparen. Es ist strategisch besser, sich mit dem Argumentarium auf die TrägeMenge und die WechselMenge zu konzentrieren.

Besten Dank für das aufschlussreiche Gespräch!

Gerne doch und behalten Sie in Erinnerung:   

>> Die ai-one™ Technologie-Lösungen geben Antworten auf Fragen, welche noch nicht gestellt wurden. <<

© ai-one | wd | Januar 2022

Questions for Walt Diggelmann on the topic:

FAKE-NEWS & INFLUENCER: IN

In the book: Semantic Systems in Use, you talk about Fake News, among other things. What does that have to do with Influencers?

Influencers who spread fake news as a big reality to achieve a certain political goal can be dangerous for a democracy!

How do you mean that exactly?

We have talked in the other articles about the fact that the spectrum of fake news ranges from tendentious to exaggerated to outright lies.

Whether someone wants to win a majority for or against a political party, a single person, or a cause, it has unfortunately become the norm to use fake news or highly colored and tendentious information if one believes that it serves one's own cause.

What do Influencers, have to do with it?

Influencers are people who influence other people via social media. This can be about opinions and views or about products and things. In any case, it's about convincing as many people as possible in a certain direction.

What is the motivation of the Influencer?

Many influencers act from deep conviction, and reality-based, others simply for money. In addition, it may be that behind an influencer is not a person, but a so-called troll, which is a "machine" - a program, controlled manually or by artificial intelligence.

Exactly, and this is where the problem begins. Influencers have built personal trust, and people are inclined to believe them without checking their statements.

The targeted use "abuse" of Influencer is a great danger to democracy.

Influencers are often active in closed circles. This prevents opposing opinions from being discussed in an open discourse. In addition, the origin of the basic information is obscured, so that nothing can be verified or can only be verified at great expense.

One must repeat something often enough and it becomes the truth for individuals in the circle.

That's right, in the past 50 or a hundred years ago, newspapers were very conscientious in their research. False reports were rare, and what was in the newspaper could usually be classified as facts. This is no longer the case today, because only 30% of the articles are written by a human being. 70% are automatically "stolen" together and are often reproduced uncontrolled or unverified 1:1, or even fully automatically rewritten and edited, which tends to make the articles worse. This has nothing to do with journalism on ethical principles!

OK, let's get to the POINT

When it comes to human opinion formation, it can be stated that there is a 20-30-50 rule:

What does the 20-30-50 rule mean 

For example, when it comes to a vote on a subject, we can see that the opinions can always be divided into three groups from the beginning.

The three positions are:

  • YES position
  • No position
  • Undecided position

When it comes to a decision, those people who have already dealt with the issue, or are directly affected by the issue, already have a clear opinion and position. All persons who are not yet affected have yet to form an opinion and are undecided.

If one looks at the many publicly accessible statistics and election evaluations or expert opinions, then one can come to the following strongly simplified conclusion:

ca. 50% of the people form a majority opinion. The opinion of the majority is usually not very differentiated and simply inert. Often the majority simply does not want to change anything. So are traditionally on the con-servative "no" position. Let's call this crowd the: TrägeMenge

ca. 30% of people have an indecisive opinion, which can tip to "YES" or "NO". Often this group has an alternating opinion, i.e. they change unpredictably between the "YES" and "NO" position on supposedly the same subject matter. Let us call this group: WechselMenge

ca. 20% of the people always have a minority position. No matter on which topic. Let's call this group: MindeheitsMenge

The percentages are not sacrosanct, each group can also have 5%-10% more or less, that varies from topic to topic.

OK, got it, what does that mean now?

 

In simplified terms, we must deal with 3 groups. The question is, on which group should we focus to get a secured majority?

Is there the right group?

There is only one difficult answer to this. This is mainly since parties around the world have started to question election results more and more if they are not in their favor. Fake news is probably the most famous term that has been introduced to express political displeasure and discredit election results.

This damaging tendency has led to issues being fought over in a much more emotional and personal way. Positions are defended very emotionally, and discussions are no longer factual but personal and hurtful.

What influence does this have on the persuasion strategy?

Political discourse no longer takes place; only preconceived convictions prevail, which can no longer be overturned. This is partly since many political meetings and discussions are no longer held publicly, but in closed social media groups. The participants become blind to this. They unconditionally and indiscriminately follow their trusted influencers.

This leads many people to adopt a very rigid and sometimes ignorant attitude. Although they claim to be tolerant and demand a lot of tolerance from "the others," they themselves are anything but tolerant. 

On what issues does that resonate most?

Before Covid-19, religion, and politics in particular, have strongly polarized and influenced people. Today, the topic of *health & vaccination* is added to the mix.

Especially with Covid-19, many people fall for fake news. Political parties want to take advantage of the Covid-19 affair and use Fake-News, tendentious reports, and strongly blinded views to announce certain political positions and to influence as many people as possible.

It is noticeable that such extreme persuasive positions are more common among the minority crowd.

Which opinion group should we focus on now?

I would suggest it like this:

TrägeMenge 

That the inert crowd stays and does not migrate to the minority.

Unentschlossene     

The crowd of the undecided. This must be the main goal. In this way, losses in the inert crowd can be compensated for and majorities can be created. 

Minderheiten           

Forget, as a rule it is illusory to convince the 20% minority of another position. This energy can be saved. It is strategically better to concentrate on the inertia and the change of opinion with the argumentation.

Thank you very much for the insightful conversation!

You are welcome and keep in mind:  

>> The ai-one™ technology solutions provide answers to questions that have not yet been asked <<

© ai-one | wd | January 2022

Fragen an Walt Diggelmann zum Thema:

Gepräge Botschaften

Sie sprechen im Buch über «geprägte Botschaften», können Sie uns das näher erklären?

Das sind Botschaften, welche gezielt Inhalte vermitteln, die nicht den Tatsachen entsprechen. Sie sind in einer Art formuliert, welche einen bestimmten Zweck erfüllen soll, in dem falsche Informationen wiedergegeben werden oder der Kontext so manipuliert wurde, dass eine neue Botschaft entsteht.

Geprägte, also tendenziös verfasste Botschaften sind Botschaften, welche politisch, emotional, oder aus anderen Motiven übertrieben oder dramatisiert sind. In einzelnen Fällen sind solche Botschaften mutwillig und mit krimineller Energie verfälscht. Das sind Lügen, auch bekannt als «Fake News».

Was ist die Motivation zu solchen Botschaften? 

Da gibt es mannigfache Gründe. Bei Prozessen und Gerichtsverfahren geht es um die Verschleierung von Tatsachen und Sachverhalten oder um die Begünstigung/Benachteiligung von Personen. 

In der Politik geht es um das Erreichen von Zielen. Man erhofft sich durch Dramatisierungen und Optimierungen Inhalte und Botschaften dahingehend zu verändern und darzustellen, so dass sie den eigenen Interessen und Strategien entsprechen. Dabei werden Botschaften positiv wie negativ beschönigt.

Was hat das mit ML & AI zu tun?

Um Botschaften präzise zu verstehen und einzuordnen, benötigt der Empfänger den gleichen Wissenshorizont wie der Sender. Bei geprägten Botschaften ist es um so wichtiger, einen gleichen Wissenshorizont zu haben und es ist hilfreich die Umstände und Motivation zur Botschaft zu kennen. So kann sich der Empfänger mit dem Sender gedanklich synchronisieren und verstehen, welche Absicht der Sender mit seiner Botschaft verfolgt.

Wie kann da ML & AI helfen?

Die Frage stellt sich, müssen Botschaften von ML & AI zuerst verstanden werden, um sie vergleichen zu können?

Und - müssen sie?

Nein - das ist das Raffinierte.

Das müssen Sie näher erklären!

Stellen Sie sich vor, es liegt ein Text vor Ihnen, aber niemand liest ihn! Hat dieser Text trotzdem eine Botschaft? 

Das habe ich mir noch nie überlegt, hat er?

Ja genau, er hat eine Botschaft. Wir nennen das die intrinsische oder inhärente Semantik (= innewohnende Semantik). Die Worte in einem Text werden nach den Regeln der Grammatik der verwendeten Sprache platziert und sind nicht in einer zufälligen Reihenfolge. Das bedeutet, jeder Text, der nach einer Grammatik folgenden geschrieben ist, hat eine intrinsische Semantik (Botschaft) auch wenn er nicht gelesen oder verstanden wird.

Was bedeutet das für das ML & die AI?

Indem man diesen Text in ein maschinenlesbares Format konvertiert, ohne dabei die Semantik zu verändern, kann ML eine neutrale Analyse ausführen.

Dieses maschinenlesbare Format nennen wir den semantischen Fingerprint. Mit dem semantischen Fingerprint wird ein Vektorraum erstellt, in dem die unveränderte Botschaft maschinenlesbar konvertiert wurde.

Jetzt können mit Hilfe von ML & AI blitzschnell unterschiedliche semantischen Analysen erstellt werden. Der semantische Fingerprint kann auch dazu benutzt werden, den Wissenshorizont zu erweitern und zu synchronisieren.

Ich verstehe, der semantische Fingerprint hilft der Maschine, Botschaften besser und schneller zu verstehen, in dem er hilft, den Wissenshorizont überlappend zu gestalten? Ist das so korrekt formuliert?

Ja, so kann man das sagen.

Damit ist gewährleistet, dass inhaltlich ähnliche Botschaften zum Original-Text des Senders und nicht zu meiner Beurteilung oder Auswertung und Interpretation als Empfänger gefunden werden.

Alles klar, jetzt weiss ich, warum in der Kommunikation oftmals grosse Missverständnisse entstehen können. Die ai-one™ Technologie mit der Applikation BrainDogs™ hilft, Missverständnisse aufzulösen. 

Ja genau!

Wir sagen in unserem 10 Sekunden Werbespot:

>> ai-one™ gibt Antworten auf Fragen, welche noch nicht gestellt wurden. <<

© ai-one | wd | Oktober 2021

Questions for Walt Diggelmann on the topic:

Semantic Data Intelligence

You talk in the book about "biased messages" can you explain that to us in more detail?

These are messages that specifically communicate content that does not correspond to the facts. They are formulated in a way that is intended to serve a specific purpose, in which false information is reproduced or the context is manipulated to create a new message.

Biased messages are messages that are exaggerated or dramatized politically, emotionally, or for other reasons. In individual cases, such messages are deliberately and with criminal energy distorted, these are lies, also known as "fake news".

What is the motivation for such messages? 

There are many reasons for it. In lawsuits and court proceedings, it is about the concealment of facts and circumstances or about the favoring/disadvantaging of persons. 

Politics is about achieving goals. It is hoped that dramatizations and optimizations will change and present content and messages in such a way that they correspond to one's own interests and strategies. In the process, messages are embellished both positively and negatively.

What does this have to do with ML & AI?

To understand and classify messages precisely, the receiver needs the same knowledge horizon as the sender. With biased messages it is even more important to have the same knowledge horizon and it is helpful to know the circumstances and motivation for the message. In this way, the receiver can synchronize with the sender and understand what the sender's intention is with his message.

How can ML & AI help?

The question arises, do messages need to be understood first to be able to be compared by ML & AI?

And - do you have to?

No - that's the clever part.

You must explain that in more detail!

Imagine, there is a text in front of you, but nobody reads it! Does this text still have a message? 

I have never thought about that, does it?

Yes, exactly, it has a message. We call this the intrinsic or inherent semantics. (= native semantics) The words in a text are placed according to the rules of grammar of the language used and are not of a random order. This means any text written according to a grammar following has intrinsic semantics (message) even if it is not read or understood.

What does this mean for ML & AI?

If you can manage to convert this text into a machine-readable format without changing the semantics, ML can perform neutral analysis.

We call this machine-readable format the semantic fingerprint. The semantic fingerprint creates a vector space into which the unmodified message has been machine-readably converted.

Now ML & AI can be used to create a wide variety of semantic analyses at fast speed. The semantic fingerprint can also be used to synchronize the knowledge horizon.

I understand, the semantic fingerprint helps the machine to understand messages better and faster, in that it helps to overlap the knowledge horizon? Is that the correct way to put it?

Yes, you can put it that way.

This ensures that messages similar in content are found to the original text from the sender and not to my judgment or evaluation and interpretation as the receiver.

All right, now I know why big misunderstandings can often arise in communication. The ai-one™ technology with the BrainDogs™ application helps resolve misunderstandings. 

Yes exactly!

We say in our 10 second elevator pitch:

>> ai-one™ gives answers to questions that haven't been asked yet. <<

© ai-one | wd | October 2021


Download

Fragen an Walt Diggelmann zum Thema:

Fake News

Sie sprechen im Buch: Semantische Systeme im Einsatz, über Fake News, können Sie das näher erläutern?

Beim Thema Fake News, oder Lügenpresse geht es darum, wie man Falschmeldungen erkennen und die Autoren entlarven kann.

Das Problem dabei ist, dass das bei gut gemachten Artikeln nicht einfach ist!

Will heissen? 

Gut erstellte Fake News können nicht unbedingt direkt erkannt werden. Wenn sie grammatikalisch ohne Fehler sind, stilistisch in guter Qualität, logisch im Aufbau des Inhalts, mit möglichen Hintergrundgeschichten und Quellen mit Begründungen, vielleicht noch mit Zitaten und Bildern unterlegt sind. Also vordergründig ist alles da, um die Botschaft als glaubhaft und tatsachenbasierend darzustellen.

OK, - und was nun? 

Eine Botschaft basiert immer auf mehreren Punkten, welche einzeln validiert werden können:

  • Wer ist der Sender, ist er bekannt, validiert?
  • Wie ist der Sender vernetzt, in welchen Abhängigkeiten oder Interessenkonflikten steht der Sender?
  • Ist der Sender auch der Autor/Quelle?
  • Ist der Sender inhaltlich als Experte qualifiziert?
  • Wie oft ist der Sender aktiv?
  • Wen hat der Sender adressiert?
  • Wurde dieselbe Botschaft inhaltlich oder kongruent von anderen Sendern/Quellen bestätigt?
  • Wurde die Botschaft von validierten Empfängern bestätigt und sogar weiterverbreitet?
  • Was könnte die Motivation für die Botschaft sein?
  • Woher stammt die Botschaft und worüber, war der Autor Augenzeuge oder ist es Hörensagen?
  • Was ist die mutmassliche Aussage der Botschaft?
    ... diverse weitere Kriterien

Ah, ich verstehe, die Beurteilung einer Botschaft basiert nicht nur auf dem einzelnen Inhalt.   

Ja genau, man muss immer das erweiterte Bild, den erweiterten Kontext dazu haben. Eine Kurz-Botschaft kann nicht seriös validiert werden, ausser sie stammt aus einer 100% validierten Quelle und ist über einen Inhalt, der bereits bekannt und validiert ist

Es geht also um Sender, Kontext, Zeit, Ort, Motivation und Bestätigung?

Korrekt, eine exakt gleiche Botschaft, welche in einem anderen Kontext, an einem unterschiedlichen Ort und in einer anderen Zeit tatsächlich gesprochen/geschrieben wurde, kann heute eine ganz andere Bedeutung haben.

Man kann also tatsächliche Aussagen nehmen, und sie in die heutige Zeit übernehmen und behaupten, es sei eine aktuelle Tatsache. Das ist Betrug, weil die Botschaft komplett aus dem inhaltlichen und zeitlichen Kontext gerissen wurde, um sie unlauter für die eigenen oder die Ziele einer bestimmten Gruppe einzusetzen.

Wobei man nicht extra in die Vergangenheit gehen muss, das geht auch mit aktuellen Zitaten. Der Vorteil der Begründung aus der Vergangenheit ist, da sich die Mehrheit der Empfänger und Leser dann nicht die Mühe machen, die Behauptungen zu überprüfen. Zitate aus der Aktualität sind einfacher zu überprüfen.

Sprechen wir noch etwas detaillierter über die Quelle, den Sender oder Autor von Fake News.

Ein anderes wichtiges Beurteilungskriterium sind die Autoren und Personen/Firmen oder Institutionen, welche hinter den Fake News stehen, sofern man diese überhaupt identifizieren kann.

Oftmals heisst es, dass die Quelle oder der Autor sich bedeckt halten oder verstecken müsse, weil er/sie sonst Sanktionen erwarten müsse und mehr.

Würde die Presse und die Publizisten grundsätzlich anonyme oder nicht überprüfbare Quellen ignorieren, wären wir schon einen Schritt weiter bei einer glaubhaften Informationspolitik. Würden wir darüber hinaus grundsätzlich immer die Vernetzung und Abhängigkeiten der Personen oder Firmen aufgezeigt, welche News verbreiten, könnte sich auch der normale Nutzer besser ein Bild machen, wem er was glauben soll.

Wie kann diese Situation verbessert werden?

Der Nutzer benötigt Hilfe, bei der Beurteilung von Nachrichten, ML & AI können zukünftig dem Empfänger und Leser Werkzeuge geben, mit denen er selbständig Fake News entlarven kann! Das können Funktionen im Browser oder als APP sein, es könnten auch zusätzliche Services und Funktionen bei den News- und Sozial Media Plattformen sein.

Medienunternehmen, welche künftig eine Fake News Überprüfungs-Funktion anbieten, werden die Nase vorne im Wettbewerb haben. Es ist besser News und Informationen zu validieren, anstelle zu zensurieren.

Das klingt spannend und ich habe weitere Fragen, wir kommen auf dieses Thema bestimmt in einer weiteren Fragerunde zurück.

Gerne - behalten Sie in Erinnerung:   

>> ai-one™ gibt Antworten auf Fragen, welche noch nicht gestellt wurden. <<

© ai-one | wd | Oktober 2021

Questions for Walt Diggelmann on the topic:

Fake News

In the book: Semantic Systems in Use, you talk about Fake News, can you explain that further?

The topic of fake news, or the lying press, is about how to recognize false reports and expose the authors.

The problem is that this is not easy with well-made stories!

Meaning? 

Good fake news cannot necessarily be recognized directly. If they are grammatically without errors, stylistically in good quality, logically in the structure of the content, with possible background stories and sources with justifications, and perhaps even with quotes and images are underpinned. So ostensibly everything is there to present the message as credible and fact-based.

OK, - and what now? 

A message is always based on several points, which can be validated individually:

  • Who is the sender, is he known, validated?
  • How is the sender networked, in which dependencies or conflicts of interest does the sender stand?
  • Is the sender also the author/source?
  • Is the sender qualified as an expert in terms of content?
  • How often is the sender active?
  • Who has the sender addressed
  • Has the same message been validated in content or congruently by other senders/sources?
  • Has the message been validated and even retransmitted by validated recipients?
  • What could be the motivation for the message
  • Where does the message come from and about what, was the author an eyewitness or is it hearsay?
  • What is the presumed statement of the message?
    ... various other criteria

Ah, I see, the evaluation of a message is not only based on the single content.  

Yes exactly, one must always have the extended picture, the extended context to it. A short message cannot be seriously validated, unless it comes from a 100% validated source and is about a content that is already known and validated.

So, it's about sender, context, time, place, motivation, and confirmation?

Correct, on the one hand and exactly same message, which was spoken/written in another context, at another place and in another time, can have a completely different meaning today.

So, one can take actual statements, and take them into today's time, and claim that it is a current fact. That is fraud, because the message was torn completely from the content wise and temporal context, to use it unfairly for the own or the goals of a certain group.

Whereby one does not have to go specially into the past, that goes also with current quotations. The advantage of quoting from the past is that most recipients and readers will not bother to check the claims. Quotations from the actuality are easier to verify.

Let's talk in more detail about the source/sender, or author of Fake News.

Another important criterion for evaluation is the authors, person’s/companies, or institutions behind the Fake News, if they can be identified at all.

It is often said that the source or author must keep a low profile or hide, because otherwise he/she would have to expect sanctions and more.

If the press and journalists were to ignore anonymous or unverifiable sources as a matter of principle, we would already be one step closer to a credible information policy. If, in addition, we were always to clarify the networks and dependencies of the people or companies that distribute news, the normal user would also be able to get a better idea of who to believe what.

How can this situation be improved?

The user needs help in evaluating news, ML & AI can give the recipient and reader tools in the future with which he can independently unmask fake news! This can be functions in the browser or as APP, it could also be additional services and functions in the news and social media platforms.

Media companies that offer a fake news verification function in the future will be ahead of the competition. It is smarter to validate news and information instead of censoring it.

That sounds exciting and I have further questions, we will come back for sure to this topic in another Q&A session.

You're welcome - keep in mind:  

>> ai-one™ gives answers to questions which have not been asked yet. <<

© ai-one | wd | October 2021


Download

Fragen an Walt Diggelmann zum Thema:
Wissenshorizont

Im Kapitel 11 vom Buch: «Semantische Daten Intelligenz im Einsatz» sprechen Sie vom Wissenshorizont, können diesen erklären?

Beim Wissenshorizont geht es um zwei Überlegungen:

  1. Inwiefern spielt der Wissenshorizont eine Rolle, wenn Botschaften zwischen Sender und Empfängern ausgetauscht werden.
  2. Wie kann der Wissenshorizont erweitert beziehungsweise synchronisiert werden.

Woher stammt dieses Konzept des Wissenshorizonts?

Hans-Georg Gadamer, ein deutscher Philosoph, hatte den Begriff der Hermeneutik und des Wissenshorizonts in seinem Buch «Wahrheit und Methode» ausführlich besprochen.

Gadamer versteht die Hermeneutik weder als Theorie noch als Methode oder Methodik. Vielmehr ist sie das Phänomen des Verstehens und der sachgerechten Auslegung des Verstandenen. Im Werk bemüht sich Gadamer um die Herausbildung der Begriffe Wahrheit, Sinn, Erkenntnis und Verstehen.

Eine hermeneutische Regel ist, das Ganze aus dem Einzelnen und das Einzelne aus dem Ganzen zu verstehen. Die Bewegung des Verstehens läuft von einem zum anderen und wieder zurück, wobei das Verständnis von beidem erweitert wird (hermeneutischer Zirkel).

Einfach gesprochen:
Man muss vorher wissen, was man nachher verstehen möchte!

Können Sie das näher erklären.

Wenn ich Ihnen eine Botschaft über ein Thema sende, von dem Sie vorher noch nie etwas gehört haben und ich dabei ein Vokabular verwende, welches Ihnen fremd ist, haben sie keine Chance die Botschaft zu verstehen.

Das klingt logisch und nachvollziehbar.  

Viele Start-up Firmen, Wissenschaftler und Visionäre machen oftmals den Fehler, dass sie die Neuerungen und Erfindungen zu abstrakt und zu weit in der Zukunft erklären.

Was wir uns nicht vorstellen / verstehen können (wollen), kann nicht sein.

Der Mensch bezieht oftmals eine Abwehrhaltung, wenn er eine Veränderung durch Neuheiten befürchtet. 

Das bedeutet, neue Themen müssen schrittweise erklärt werden.

Wir Menschen bevorzugen kleine Wissens-Schritte. Jede neue Information muss mit dem Bisherigen verarbeitet und verstanden werden, so dass daraus neues Wissen entstehen und gespeichert werden kann. 

Gadamer sagt: Das Verstehen ist eine Anwendung auf eine Situation. Die Anwendung beinhaltet eine Auseinandersetzung mit dem Text durch seine Infragestellung. So ist der Sinn eines Textes losgelöst von der Intention des Autors zu verstehen.

Wir nennen das die inhärente Semantik. Also die Botschaft des Textes, ohne dass er von einem Menschen interpretiert wird.

Gadamer sagt weiter: Die Hermeneutik ist eine Reflexion darüber, was mit einem selbst in einem Dialog geschieht: sich selbst verstehen im Verstehen einer Sache.

Es geht also im Wesentlichen darum, eine Botschaft möglichst im Sinne des Verfassers zu verstehen.

Die grosse Herausforderung ist, dass der Verfasser einer Botschaft, diese auf der Basis seines persönlichen Wissenshorizonts verfasst. Damit diese Botschaft im Sinne des Autors verstanden werden kann, sollte der Leser, über einen gleichen/ähnlichen Wissenshorizont verfügen.

Wie kann der Leser seinen Wissenshorizont erweitern, wenn er ja noch nicht verstanden hat, was er eigentlich neu lernen soll?

Das ist die Herausforderung, man könnte auch sagen das Paradoxon. Zum Glück ist es selten so, dass Botschaften gar keine Überlappung mit vorhandenem Wissen haben. So ist es in der Regel möglich Brückentexte zu identifizieren, um uns neuem Wissen anzunähern. Allerdings kann das sehr zeitaufwendig sein. An der Stelle kann ML (Maschine Learning) und AI (Artificial Intelligence) helfen!

Wie kann die ML/AI das?

Neueste ML- und AI-Lösungen sind in der Lage, die inhärente Botschaft in einen semantischen Fingerprint zu überführen. Die Worte sind nicht in zufälliger Reihenfolge, sondern folgen einer Grammatik, welche die inhärente Semantik speichert. Mit dem semantischen Fingerprint kann die Botschaft mit Millionen anderer Texte verglichen werden. «Semantic Matching»

Die Matches (Treffer) werden mittels einer Prozentzahl von 0 bis 100% Match deklariert. Alle Matches zwischen 85% und 99% sind leicht unterschiedlich zum Originaltext formuliert, aber inhaltlich nahe. Das könnten Brückentext zu meinem Wissen sein!

ML kann also dazu genutzt werden, Texte mit ähnlichen Botschaften zu finden, in der Hoffnung, dass ich so mein Wissen schrittweise erweitern kann!

Damit ist gewährleistet, dass inhaltlich ähnliche Botschaften zum Original-Text ohne vorherige Interpretation gefunden werden.

Alles klar, daher Ihr Werbespruch

ai-one™ gibt Antworten auf Fragen, welche noch nicht gestellt wurden.

© ai-one | wd | 20. October 2021

Questions for Walt Diggelmann on the topic:
Knowledge Horizon

In chapter 11 of the book: "Semantic Data Intelligence in Use" you talk about the knowledge horizon, can you explain it?

The knowledge horizon involves two considerations:

  1. To what extent does the knowledge horizon play a role when messages are exchanged between senders and receivers.
  2. How can the knowledge horizon be expanded or synchronized?

Where did this concept of the knowledge horizon come from?

Hans-Georg Gadamer, a German philosopher, had discussed the concept of hermeneutics and the knowledge horizon in detail in his book "Truth and Method".

Gadamer understands hermeneutics neither as a theory nor as a method or methodology. Rather, it is the phenomenon of understanding and the proper interpretation of what is understood. In the work, Gadamer endeavors to bring out the concepts of truth, meaning, cognition, and understanding.

A hermeneutic rule is to understand the whole from the individual and the individual from the whole. The movement of understanding runs from one to the other and back again, expanding the understanding of both (hermeneutic circle).

Simply spoken:
You must know beforehand what you want to understand afterwards!

Can you explain this in more detail?

If I send you a message about a subject you have never heard of before and I use vocabulary that is foreign to you, you have no chance of understanding the message.

This sounds logical and understandable. 

Many start-up companies, scientists, and visionaries, often make the mistake that they explain the innovations and inventions too abstract and too far in the future.

What we can’t (want) imagine / understand, must not be.

People often take a defensive attitude when they fear a change caused by novelties. 

This means that new topics must be explained step by step.

We humans prefer small knowledge steps. Every new information must be processed and understood with the previous one, so that new knowledge can be created and stored from it. 

Gadamer says: Understanding is an application to a situation. Application involves an engagement with the text through its questioning. Thus, the meaning of a text is to be understood detached from the author's intention.

We call this the inherent semantics. That is, the message of the text without being interpreted by a human being.

Gadamer goes on to say, "Hermeneutics is a reflection on what happens to oneself in a dialogue: understanding oneself in understanding a thing.

So, it is essentially about understanding a message as much as possible in terms of the author.

The great challenge is that the author of a message writes it based on his personal knowledge horizon. For this message to be understood in the author's sense, the reader should have the same/similar knowledge horizon.

How can the reader expand his knowledge horizon, if he has not yet understood what he is supposed to learn?

This is the challenge; one could also say the paradox. Fortunately, it is rarely the case that messages have no overlap at all with existing knowledge. So, it is usually possible to identify bridge texts to approach new knowledge. However, this can be very time consuming. This is where ML (machine learning) and AI (artificial intelligence) can help!

How can ML/AI do that?

Latest ML and AI solutions can convert the inherent message into a semantic fingerprint. The words are not in random order but follow a grammar that stores the inherent semantics. With the semantic fingerprint, the message can be compared to millions of other texts. "Semantic Matching."

Matches (hits) are declared using a percentage from 0 to 100% match. All matches between 85% and 99% are formulated slightly different from the original text, but close in content. This could be bridge text to my knowledge!

So, ML can be used to find texts with similar messages in the hope that I can expand my knowledge step by step!

This ensures that messages similar in content to the original text are found without pre interpretation.

All right, hence your advertising slogan

ai-one™ gives answers to questions, which have not been asked yet.

© ai-one | wd | 20. October 2021


Download

Fragen an Walt Diggelmann zum Thema:

Semantischer Fingerprint

Im Kapitel 11 vom Buch: «Semantische Daten Intelligenz im Einsatz» sprechen Sie vom semantischen Fingerprint, können Sie diesen etwas genauer erklären?

Jeder kennt den forensischen Fingerprint und die Eigenschaft, dass alle Fingerprints unterschiedlich sind, selbst bei eineiigen Zwillingen.

Das ist so, was hat das jetzt mit Semantik zu tun?

Beim forensischen Fingerprint besteht die Datei aus sogenannten «Minutiaen». Das sind charakteristische Punkte beim Linienverlauf der Rillen in den Händen und Fingerkuppen.  

Genau, das sind die sogenannten Templates, welche aus dem gescannten Fingerprint-Bild konvertiert wurden, diese können mit Computerprogrammen blitzartig mit Hunderten Millionen anderer Templates verglichen werden.

Betrachtet man die Worte nun auch als Datenpunkte in einem Text und die Abfolge der Worte als Kette und Verlauf, so kann man daraus eine Charakteristik und ein Muster erkennen, wie bei den Minutiaen.

Aha, ich verstehe, Sie betrachten einen Satz also nicht als ASCII Worte, sondern als eine Art Mustergrafik.

Jeder Text setzt sich aus Buchstaben, Wörtern und Sätzen zusammen. Daraus leiten wir Menschen eine Botschaft ab. Betrachtet man die Buchstaben, Worte und Satzstellung abstrahiert als Datenpunkte, so kann man aus der Anordnung und Abfolge der Worte ein Muster ableiten. Dabei ist ein Wort ein Datenpunkt und kann aus einem oder mehreren Buchstaben bestehen. (vereinfacht erklärt).

Wie verstehen wir Menschen ein solches Text-Muster?

Damit Menschen Texte verstehen, haben sie sich auf einen gemeinsamen Buchstabensatz und auf eine Rechtschreibung (Orthografie) und Satzstellung (Grammatik) geeinigt. So ist es möglich, dass Sender und Empfänger die Botschaft grundsätzlich verstehen.

Damit die Botschaft möglichst im Sinne des Autors verstanden wird, sollte bei der Textanalyse neben der Syntaktik und Semantik auch die Pragmatik mit analysiert werden. Damit wird es zum Semiotischen System. Die Semiotik definiert sich aus dem Zusammenspiel der 3 Basis-Elemente:

Semiotik:    Syntax | Semantik | Pragmatik

Das ist so weit klar, aber das «Zusammenspiel» ist noch unklar! Vielleicht erklären Sie zuerst die Begriffe.

Semiotik: ist die Wissenschaft von den Zeichenprozessen in Kultur und Natur. Dabei werden Zeichen wie Buchstaben, Wörter, Hieroglyphen, aber auch Bilder, Skizzen, Zeichnungen, Piktogramme sowie Gesten verstanden. Sie alle vermitteln Informationen aller Art über die Zeit und den Ort bei der Entstehung einer Botschaft. Semiotik, Syntax, Semantik und Pragmatik sind nicht nur auf die Linguistik beschränkt, sondern beziehen sich auf Zeichen und Botschaften im Allgemeinen.

Die Semiotik ist also das Resultat des Zusammenspieles zwischen Syntax, Semantik und Pragmatik im grösseren Allgemeinen gesprochen. 

Genau, vor allem bringt die Semiotik die Pragmatik mit in die Betrachtung. Erst wenn die Pragmatik mit in die Analyse einer Botschaft einbezogen wird, spricht man von Semiotik und dadurch kann eine Botschaft genauer ausgewertet werden, weil dann oftmals auch die Motivation zur Botschaft klar wird.

Ok, dann müssen sie noch die anderen drei Begriffe erläutern.

Syntax: Ist die Lehre vom Bau des Satzes als Teilgebiet der Grammatik; der Satzlehre. Diese zeigt die in einer Sprache übliche Verbindung von Wörtern zu Wortgruppen und Sätzen; die korrekte Verknüpfung sprachlicher Einheiten im Satz.

Semantik: ist die Lehre im Teilgebiet der Linguistik, die sich mit den Bedeutungen sprachlicher Zeichen und Zeichenfolgen befasst. Also Bedeutung, Inhalt (eines Wortes, Satzes oder Textes).

Pragmatik: beschäftigt sich in der Linguistik mit der Beschreibung von kontextabhängigen und nicht-wörtlichen Bedeutungen bei der Verwendung von sprachlichen Ausdrücken in jeweils konkreten Situationen und mit den Bedingungen für ihr Entstehen. Vereinfacht: der Bezug zur Realität

Wie kommt jetzt der semantische Fingerprint ins Spiel?

Wenn wir uns also einig darüber sind, dass alle korrekt aufgebauten Texte, egal ob sie gelesen werden oder nicht, inhärenten Regeln der Semiotik folgen, dann haben Texte immer eine inhärente Botschaft, selbst wenn sie weder gelesen noch interpretiert werden. Die Kunst ist jetzt, diese inhärente Botschaft, oder intrinsische Semantik wie wir diese bezeichnen, in eine maschinenlesbare Form zu überführen.

Wozu ist das wichtig?

Wenn es gelingt, die inhärente Botschaft automatisch maschinenlesbar zu konvertieren, und dabei keine Veränderung oder Deutung am Text vorzunehmen, wird wie in der Forensik, ein generischer Fingerprint der Botschaft gebildet.

Der semantische Fingerprint ist ein multidimensionaler Vektorraum, in dem das semantische Muster der Botschaft gespeichert ist.

Es ist ein Faksimile der Botschaft. Nachfolgende Prozesse können den Fingerprint weiter auswerten und in Kontext stellen, mit anderen Botschaften vergleichen und matchen etc. Der semantische Fingerprint ist ein optimales Daten-Transport-Format, so gesehen der optimale Input für nachfolgende ML- (maschinelles Lernen) und KI- (Künstliche Intelligenz) Systeme.

Worin liegt der Vorteil, wenn Botschaften maschinenlesbar sind? 

Der Vorteil von ML und KI liegt in der schnellen Verarbeitung von grossen Textmengen durch die Computer Systeme. Sobald die Botschaft maschinenlesbar ist, können Computer massiv mehr Information verarbeiten und übersehen dabei nichts. Sie werden nicht müde und sind 7/24 bereit.

ML kann dank dem semantischen Fingerprint irgendwelche Botschaften, ohne diese zu verstehen vergleichen, matchen, klassifizieren und sortieren. Damit ist gewährleistet, dass inhaltlich ähnliche Botschaften ohne vorherige Interpretation gefunden werden. Für die Interpretation kann in der Folge dann nochmals ML und KI eingesetzt werden.

Ich verstehe, ML und KI können so blitzschnell in Millionen von Texten nach Ähnlichkeiten, Widersprüchen, unterstützenden oder negierenden Botschaften suchen.

Alles mit dem Ziel, dem Menschen eine möglichst ausgewogene Informations-Basis zu geben, damit er die bestmögliche Entscheidung treffen kann. Es gibt nichts Gefährlicheres, als wenn sich Menschen bewusst oder unbewusst, in einer geprägten Informations-Blase bewegen und trotzdem glauben, frei und ausgewogen informiert zu sein, um ihre Entscheidungen zu treffen.

Dann wären wir wieder beim Thema Fake News oder alternativen Tatsachen. Einfach gesagt: Lügengeschichten.

Menschen, welche sich bewusst oder unbewusst in einer Informations-Blase bewegen, bemerken gar nicht, wie einseitig sie sich informieren. Paradoxerweise ist es so, dass diese Menschen das selbst nicht tolerieren, was sie von anderen fordern, alternative Ansichten! Solche stark fokussierte Personen verweigern jegliche andere Meinungen und taxieren jeden Andersdenkenden als Feind. Sie bezeichnen sich als tolerant und fordern Toleranz, sind aber zutiefst ignorant und intolerant.

Es ist wie bei an Bulimie erkrankten Menschen, diese können spindeldürr vor einem Spiegel stehen und sich selbst trotzdem als fett wahrnehmen.

Stark beeinflusste Menschen folgen bedingungslos ihrem Idol. Sie bemerken nicht, dass sie missbraucht werden, damit das Idol seine Partikular Interessen umsetzen kann.

Wir kann man solche Menschen aus diesem Tunnelblick befreien?

Es gibt immer einen Anteil von Minderheiten, welche man nicht aus ihrem Tunnel befreien kann. Da würde nur ein dramatisches Ereignis, oder der Sinneswandel des ideologischen Führers helfen. Diese Menschen sind nicht an anderen Meinungen interessiert, diese könnten ihr fixes Weltbild und ihre Glaubenssätze zerstören.

Das ist ein tragisches Bild, was sie skizzieren.

Das stimmt, aber es ist leider so.

© ai-one | wd | 25. Oktober 2021

Questions for Walt Diggelmann on the topic:

Semantic Fingerprint

In chapter 11 of the book: "Semantic Data Intelligence in Use" you talk about the semantic fingerprint, can you explain it a bit more?

Everyone knows the forensic fingerprint and the property that all fingerprints are different, even in identical twins.

Yes, I would agree, now what does that have to do with semantics?

In the forensic fingerprint, the file consists of so-called "minutiae". These are characteristic points in the lines of the grooves in the hands and fingertips.  

Exactly, these are the so-called templates, which were converted from the scanned fingerprint image. Now these vector data can be compared with a computer program in a flash with hundreds of millions of other templates.

If you also look at the words as data points in a text and the sequence of words as a chain and progression, you can also see a characteristic and a pattern from this, as with minutiae.

Aha, I see, so you don't think of a sentence as ASCII words, but as a kind of pattern graphic.

Every text is composed of letters, words, and sentences. From these, we humans derive a message. So, if you look at the letters, words and sentence order abstracted as data points, you can derive a pattern from the order and sequence of the words. Thereby a word is a data point and can consist of one or more letters. (Simplified explained)

How do we humans understand such a text pattern?

For us humans to understand texts, we have agreed not only on a common set of letters, but also on spelling (orthography) and sentence order (grammar). This ensures that the recipient understands the same message as the sender/author.

OK, we need to know this a little more precisely.

The meaning and significance of a message, also called semiotics, is formed from the interaction of 3 basic elements:

Semiotics: Syntax | Semantics | Pragmatics.

This is clear so far, but the "interaction" is still unclear! Perhaps explain the terms first.

Semiotics: is the science of sign processes in culture and nature. So, the connection between syntax, semantics, and pragmatics.

I understand, semiotics is the result of the interaction between syntax, semantics, and pragmatics. 

Exactly, if pragmatics (relation to reality) is included in the analysis of a message, a message can be evaluated more accurately.

Ok, then they still need to explain the other three terms.

Syntax: Is the study of the construction of the sentence as a branch of grammar; sentence theory. In a language usual connection of words to word groups and sentences; correct connection of linguistic units in the sentence.

Semantics: is the branch of linguistics that deals with the meanings of linguistic signs and sequences of signs. Thus meaning, content (of a word, sentence, or text).

Pragmatics: in linguistics deals with the description of contextual and non-literal meanings in the use of linguistic expressions in concrete situations and with the conditions for their emergence. Simplified: the relation to reality

Now how does the semantic fingerprint come into play?

If we agree that all correctly constructed texts, whether they are read or not, follow an inherent rule of semiotics, then texts always have an inherent message, even if they are neither read nor interpreted.

The art now is to convert this inherent message, or intrinsic semantics as we call it, into a machine-readable form.

Why is this important?

If we succeed in automatically converting the intrinsic message into a machine-readable form, without changing or interpreting the text, we create a generic fingerprint of the message, as in forensics.

The semantic fingerprint is a multidimensional vector space in which the semantic pattern of the message is stored.

It is an facsimile of the message. Subsequent processes can further evaluate and contextualize the fingerprint, compare, and match it with other messages, etc. 

The semantic fingerprint is an optimal data transport format, so seen as the optimal input for downstream ML (machine learning) and AI (artificial intelligence) systems.

What is the advantage of making messages machine-readable? 

The advantage of ML and AI lies in the fast processing of large amounts of text by computer systems. Once the message is machine-readable, computers can process massively more information and miss nothing. They don't get tired and are ready 7/24.

ML can compare, match, classify and sort any messages without understanding, thanks to the semantic fingerprint. This ensures that messages with similar content are found without prior interpretation. ML and AI can then be used again for the interpretation.

I see, ML and AI can search for similarities, contradictions, supporting or negating messages in millions of texts at lightning speed.

All with the goal of giving humans the most balanced information base possible so they can make the best decision possible.

There is nothing more dangerous than when people move, consciously or unconsciously, in an imprinted bubble (filter cloud) and still believe to be freely and well-informed to make their decisions.

Then we would be back to the topic of fake news or alternative facts. Simply put: Lying stories.

People who move consciously or unconsciously in an information bubble don't even notice how one-sided they inform themselves. Paradoxically it is so that these people do not tolerate themselves what they demand from others, alternative views! Such strongly focused persons refuse any other opinions and rate every dissenter as an enemy. They call themselves tolerant and demand tolerance, but are deeply ignorant and intolerant.

It is like people suffering from bulimia, they can stand spindly in front of a mirror and still perceive themselves as fat.

Strongly influenced people follow their idol unconditionally. They do not notice that they are abused so that the idol can implement its particular interests.

How can such people be freed from the tunnel?

There is always a percentage of minorities that cannot be freed from their tunnel. Only a dramatic event or the ideological leader's change of heart would help. These people are not interested in other opinions, which could destroy their fixed worldview and beliefs.

This is a tragic picture they sketch.

It is true, but this is unfortunately the case.

© ai-one | wd | 25. October 2021


Download

Copyright © by BII-Institute 2013-2021, info@diwa-capital.com  | SWISS MADE