LocalAI: Das Open Source Modell olmOCR installiert

Eigener Screenshot

Wie schon in mehreren Blogbeiträgen erläutert, haben wir das Ziel, einen souveränen Arbeitsplatz zu gestalten, bei dem u.a. auch Künstliche Intelligenz so genutzt werden kann, dass alle eingegebenen und generierten Daten auf unserem Server bleiben.

Dazu haben wir LocalAI (Open Source) auf unserem Server installiert. Damit können wir aktuell aus mehr als 700 frei verfügbaren KI-Modellen je nach Bedarf auswählen. Zu beachten ist hier, dass wir nur Open Source AI nutzen wollen. Siehe dazu auch AI: Was ist der Unterschied zwischen Open Source und Open Weights Models?

Bei den verschiedenen Recherchen sind wir auch auf OLMo gestoßen. OLMo 2 ist eine LLM-Familie (Large Language Models), die von Ai2 – einer Not for Profit Organisation – entwickelt wurde und zur Verfügung gestellt wird:

“OLMo 2 is a family of fully-open language models, developed start-to-finish with open and accessible training data, open-source training code, reproducible training recipes, transparent evaluations, intermediate checkpoints, and more” (Source: https://allenai.org/olmo).

Unter den verschiedenen Modellen haben wir uns die sehr spezielle Version allenai_olmocr-7b-0225 in unserer LocalAI installiert – siehe Abbildung.

“olmOCR is a document recognition pipeline for efficiently converting documents into plain text” (ebd.)

Siehe dazu auch Efficient PDF Text Extraction with Vision Language Models.

Selbstverständlich werden wir demnächst auch noch andere Möglichkeiten aus der OLMo-Familie testen und Erfahrungen sammeln.

Ein genauerer Blick auf einen Teil von “Ungewissheit”, der bisher zu wenig beachtet wird

Wenn es um die Beschreibung des Umfeldes geht, verwenden wir oft den Begriff “Ungewissheit”. Dabei wird allerdings nicht immer erkannt, dass “Ungewissheit” zwei Dimensionen enthält, die ganz unterschiedlich gehandhabt werden müssen. Einerseits sind es die “Known Unknowns“, die mit den bekannten Managementansätzen (Risikomanagement) angegangen werden können. Eine weitaus wichtigere Dimension stellen allerdings die “Unknown Unknowns” dar. Dazu habe ich folgenden Text gefunden:

“Wichtig ist beim Blick auf Ungewissheit die Unterscheidung zwischen „Known Unknowns“ und „Unknown Unknowns“. Ersteres bezieht sich auf die Bearbeitung von Risiken und das Risikomanagement. Ziel ist, nicht vollständig vorhersehbare und kontrollierbare Ereignisse gleichwohl weitmöglichst zu beschreiben und die Wahrscheinlichkeit ihres Eintretens zu berechnen. Auf dieser Grundlage erscheint es dann auch möglich, den Umgang mit Risiken zu planen und ein entsprechendes Risikomanagement zu entwickeln. Demgegenüber besteht bei „Unknown Unknowns“ Ungewissheit sowohl über die konkreten Erscheinungsformen als auch die jeweils situativen Bedingungen (Zeit, Ort, Umfang) ihres Auftretens. Risiken und das Risikomanagement lassen sich somit weitgehend dem klassischen Management mit Planung und Kontrolle zuordnen, wohingegen die „Unknown Unknowns“ die eigentliche Ungewissheit benennen und ein weitgehend „blinder Fleck“ im Projektmanagement sowie auch Management insgesamt sind” (Boehle et al 2018, in projektmanagementaktuell 1/2018).

Es wird in Zukunft immer entscheidender sein, wie Management mit beiden Dimensionen umgeht. Aktuell liegt der Fokus auf den “Known Unknowns”, für das eher klassisches Management und auf Technologien, wie z.B. auch Künstliche Intelligenz, angewendet wird – dabei werden die “Unknown Unknowns” häufig vernachlässigt. Gerade bei der Bewältigung von “Unknown Unknowns” kommt dem Menschen eine bedeutende Rolle zu, da der Mensch in der Lage ist diese Form der Ungewissheit zu bewältigen. Siehe dazu auch Über den Umgang mit Ungewissheit und Kompetenzmanagement.

Solche Zusammenhänge thematisieren wir auch in den von uns entwickelten Blended Learning Lehrgängen, Projektmanager/in (IHK) und Projektmanager/in Agil (IHK), die wir an verschiedenen Standorten anbieten. Weitere Informationen zu den Lehrgängen und zu Terminen finden Sie auf unserer Lernplattform.

Projektorientiertes Lernen bedeutet auch Sozialkompetenzen entwickeln

Für eine erfolgreiche Projektarbeit sind verschiedene Kompetenz erforderlich. Neben der Methodenkompetenz sind das auch Sozial- und Persönlichkeitskompetenzen. Die ICB 4.0 (Individual Competence Baseline) weist dazu auf verschiedene Dimensionen hin. Auch in der Projektarbeit selbst, werden dabei Kompetenzen entwickelt. Beispiele für Sozialkompetenzen im Zusammenhang mit Projekten sind (Richter 2020, in projektmanagementaktuell 1/2020):

Aufgrund der Interdisziplinarität von Projektgruppen sind regelmäßig Abstimmungsprozesse erforderlich.

Der Umgang mit Krisensituationen z. B. im Fall drohender Fristüberschreitungen ist typisch für Projektsituationen.

Auch Konflikte mit der internen und externen Projektumwelt lassen sich in der Regel nicht vermeiden, so dass die Beherrschung von Konfliktmanagement eine zentrale Kompetenz für die Projektarbeit darstellt.

Projekte leben von der Teamarbeit innerhalb des Projektteams.

Ein Großteil der Tätigkeiten in Projekten ist mit Kommunikation verbunden.

Die Fähigkeiten zur Gesprächsführung und zu Verhandlungen sind für die Gestaltung von Projektsituationen erforderlich.

Projektstrukturen trennen zwischen dispositiven und ausführenden Tätigkeiten, so dass Führungsverhalten ein relevantes Thema darstellt.

Verbindlichkeit in Bezug auf Absprachen und Termine sollte die Regel der Projektarbeit sein.

Siehe dazu auch

Hybridisierung von Kompetenzen: Kompetenzmanagement in Zeiten von Künstlicher Intelligenz

Kompetenzprofile eines Fachmanns, einer Führungskraft und eines Projektmanagers im Vergleich

Eine Projektwirtschaft benötigt auch ein projektbasiertes Lernen (PBL)

John Dewey: Projektmethode und lebenslanges Lernen

Solche Zusammenhänge thematisieren wir auch in den von uns entwickelten Blended Learning Lehrgängen, Projektmanager/in (IHK) und Projektmanager/in Agil (IHK), die wir an verschiedenen Standorten anbieten. Weitere Informationen zu den Lehrgängen und zu Terminen finden Sie auf unserer Lernplattform.

Daten als Ressource: Um welche Kategorien von Daten geht es?

Wir sind uns alle einig, dass Daten eine bedeutende Ressource für einzelne Personen, Unternehmen, Organisationen und ganze Gesellschaften darstellen. Einerseits müssen Daten offen verfügbar sein, andererseits allerdings auch geschützt werden. Insofern macht es Sinn, verschiedene Kategorien für Daten zu unterscheiden:

Open data: data that is freely accessible, usable and shareable without restrictions, typically under an open license or in the Public Domain36 (for example, OpenStreetMap data);
Public data: data that is accessible to anyone without authentication or special permissions
(for example, Common Crawl data). Note that this data can degrade as web content
becomes unavailable;
Obtainable data: data that can be obtained or acquired through specific actions, such as
licensing deals, subscriptions or permissions (for example, ImageNet data);
Unshareable non-public data: data that is confidential or protected by privacy laws,
agreements or proprietary rights and cannot be legally shared or publicly distributed”
(Tarkowski, A. (2025): Data Governance in Open Source AI. Enabling Responsible and Systemic Access. In Partnership with the Open Source Initiative).

Es zeigt sich, dass es viele frei verfügbare Daten gibt, doch auch Daten, die geschützt werden sollten.

Die amerikanischen Tech-Konzerne möchten alle Daten für ihre Trainingsdatenbanken (LLM: Large Language Models) kostenlos nutzen können. Das Ziel ist hier, die maximale wirtschaftliche Nutzung im Sinne einiger weniger Großkonzerne. Dabei sind die Trainingsdaten der bekannten KI-Modelle wie ChatGPT etc. nicht bekannt/transparent. Die Strategie von Big-Tech scheint also zu sein,: Alle Daten “abgreifen” und seine eigenen Daten und Algorithmen zurückhalten. Ein interessantes Geschäftsmodell, dass sehr einseitig zu sein scheint.

Bei der chinesische Perspektive auf Daten liegt der Schwerpunkt darauf, mit Hilfe aller Daten politische Ziele der Einheitspartei zu erfüllen. Daran müssen sich alle Bürger und die Unternehmen – auch die KI-Unternehmen – halten.

In Europa versuchen wir einen hybriden Ansatz zu verfolgen. Einerseits möchten wir in Europa Daten frei zugänglich machen, um Innovationen zu fördern. Andererseits wollen wir allerdings auch, dass bestimmte Daten von Personen, Unternehmen, Organisationen und Öffentlichen Verwaltungen geschützt werden.

An dieser Stelle versucht die aktuelle amerikanische Regierung, Druck auf Europa auszuüben, damit Big-Tech problemlos an alle europäischen Daten kommen kann. Ob das noch eine amerikanische Regierung ist, oder nicht schon eine kommerziell ausgerichtete Administration wird sich noch zeigen. Das letzte Wort werden wohl die Gerichte in den USA haben.

Ich hoffe, dass wir in Europa unseren eigenen Weg finden, um offene Daten in großem Umfang verfügbar zu machen, und um gleichzeitig den Schutz sensibler Daten zu gewährleisten.

Siehe dazu Digitale Souveränität: Europa, USA und China im Vergleich.

Mit Hilfe der Stacey-Matrix klassische und agile Vorgehensmodelle im Projektmanagement abgrenzen

Vgl. Komus (2018) und eigene Ergänzungen

Wenn es darum geht, Klassische Vorgehensmodelle (Plangetriebene Vorgehensmodelle) und Agile Vorgehensmodelle abzugrenzen, wird oftmals die Stacey-Matrix herangezogen. – obwohl es mit dem Cynefin-Ansatz, dem Vorschlag von Boehm & Turner usw. auch andere Möglichkeiten gibt.

In der Stacey-Matrix werden auf der Y-Achse Anforderungen an das Projekt von “weitreichend klar” bis “geringe Klarheit” positioniert. Hier geht es somit um das WAS. Auf der X-Achse geht es um Technik/Methode, die für das Projekt “im Griff” oder auch “unklar/unsicher” sein können. Hier geht es um das WIE (Siehe Abbildung).

Es ergeben sich daraus drei Bereiche: Simpel, Kompliziert und Komplex. Weiterhin können über die Diagonale die geeigneten Vorgehensmodelle abgeleitet werden. Simpel bedeutet hier, dass die Anforderung als Routinetätigkeit angesehen werden kann. KVP ist die Abkürzung für “Kontinuierlichen Verbesserungsprozess” oder auch Kaizen. Das bedeutet, um die Anforderungen zu erfüllen, muss der Routineprozess verbessert werden. Reicht das nicht mehr aus, so kommen wir in den Bereich des (Klassischen) Projektmanagements, zu dem es Normen und Standards gibt, die sich in vielen Branchen bewährt haben.

Werden die Anforderungen und auch Technik/Methode immer unklarer, kommen wir von dem komplizierten Bereich immer stärker in einen komplexen Bereich, in dem mehr Selbstorganisation gefordert ist, um das Projekt zum Erfolg zu führen. Mit Kanban, Scrum und Design Thinking sind hier nur drei von vielen Vorgehensmodellen genannt, die dem Agilen Projektmanagement zugerechnet werden.

Der Vorteil der Stacey-Matrix liegt darin, dass sie recht einfach umsetzbar ist und somit einen schnellen und guten Einstieg dafür bietet herauszufinden, welches Vorgehensmodell für ein Projekt geeignet erscheint.

Nachteile der Stacey-Matrix sind: (1) Es sind nur zwei Dimensionen zu bewerten – bei einem komplexen Projekt möglicherweise zu wenig, (2) Das Hybride Projektmanagement wird hier nur indirekt thematisiert. Man könnte den Bereich zwischen “Kompliziert” und “Komplex” dafür nehmen, was allerdings recht ungenau wäre.

Zur Verbesserung bietet es sich an ein Analysetool zu verwenden, das mehrere Dimensionen berücksichtigt und auch die Möglichkeit des Hybriden Projektmanagements enthält. Siehe dazu Projektmanagement: Einfaches Tool zur Analyse des angemessenen Vorgehensmodells – Planbasiert, Hybrid, Agil.

Solche Zusammenhänge thematisieren wir auch in den von uns entwickelten Blended Learning Lehrgängen, Projektmanager/in (IHK) und Projektmanager/in Agil (IHK), die wir an verschiedenen Standorten anbieten. Weitere Informationen zu den Lehrgängen und zu Terminen finden Sie auf unserer Lernplattform.

Sensor Community: Umweltdaten – Open Data

Screenshot Sensor Community Website

Wir haben uns in der Vergangenheit daran gewöhnt, dass es vereinzelt Messstationen gab, an denen Umweltdaten generiert und oft von Behörden genutzt wurden. In der Zwischenzeit gibt es eine Sensor Community, bei der jeder mitmachen, und Umweltdaten frei zur Verfügung stellen kann – als Open Data.

Wie in der Abbildung zu erkennen ist, gibt es in Europa schon sehr viele, die diesen Ansatz unterstützen, und Messpunkte und Messdaten zur Verfügung stellen. Weltweit gibt es aktuell 12.101 Sensoren in 76 Ländern mit 30.703.440.715 Datenpunkten.

Da die Daten frei zur Verfügung gestellt werden (Open Data) können daraus auch eigene/neue Dienstleistungen oder auch Produkte entwickelt werden. Dieser Innovationsansatz wird von Eric von Hippel als Democratizing Innovation beschrieben. So eine Perspektive auf Innovation ist ganz anders als die übliche, die von Innovationen ausgeht, die Organisationen/Unternehmen generieren.

Siehe dazu auch Von Democratizing Innovation to Free Innovation.

Steckbrief zum Wasserfallmodell: Vorteile und Nachteile

Quelle: Timinger (2021)

In der Vergangenheit wurden hauptsächlich die Nachteile des klassischen, plangetriebenen Projektmanagements herausgestellt. Als Paradebeispiel (Negativ-Beispiel) wurde oft das Wasserfallmodell herangezogen, das nach der Meinung vieler sogenannter Experten nicht mehr zeitgemäß sei. Siehe dazu auch OpenProject: Anmerkungen zum Kritischen Weg und zu Meilensteinen und Einige Anmerkungen zum “Wasserfall-Modell” auf Basis des Originalartikels von Royce (1970.

Alles sollte (musste?) in Zukunft agil durchgeführt werden. Prominente Vorgehensmodelle waren und sind hier Scrum (Framework), Kanban, DevOps etc.

Wie bei allen neuen Ansätzen entwickelte sich daraus auch ein lohnenswertes Geschäftsmodell, von dem immer mehr Beteiligte profitieren wollten, und auch noch profitieren wollen. Nach vielen Jahren der praktischen Umsetzung stellte sich allerdings heraus, dass viele Organisationen agile Vorgehensmodelle nicht, oder nur in abgewandelter Form umsetzen, bzw. umsetzen können. Siehe dazu Hybrides Projektmanagement hat sich in vielen Unternehmen durchgesetzt (HELENA-Studie) und PMI (2024) Global Survey: Hybrides Projektmanagement wird immer wichtiger.

Es ist an der Zeit, sich die Vorteile und Nachteile von Vorgehensmodellen genauer anzusehen, um das jeweils geeignete Vorgehensmodell – bzw. deren Kombinationen – bestimmen zu können. Siehe dazu DAS Projektmanagement-Kontinuum in der Übersicht.

In der Abbildung sind die Vorteile und Nachteile für das Wasserfall-Modell dargestellt. Ja, das Modell ist ineffizient bei wenig planbaren Projektgegenständen und sich ändernden Anforderungen. Doch es gibt auch Vorteile, wie die klaren Strukturen, die manches vereinfachen. Schauen Sie sich die Übersicht an und bilden Sie sich ihre eigene Meinung dazu.

Solche Zusammenhänge thematisieren wir auch in den von uns entwickelten Blended Learning Lehrgängen, Projektmanager/in (IHK) und Projektmanager/in Agil (IHK), die wir an verschiedenen Standorten anbieten. Weitere Informationen zu den Lehrgängen und zu Terminen finden Sie auf unserer Lernplattform.

Open LLMs for Transparent AI in Europe

Screenshot Open Euro LLM

Wie schon in dem Beitrag Digitale Souveränität: Europa, USA und China im Vergleich dargestellt, haben China, die USA und Europa unterschiedliche Herangehensweisen, mit Künstlicher Intelligenz umzugehen.

Es wundert daher nicht, dass sich die neue Regierung in den USA darüber beschwert, dass Europa die Entwicklung und Nutzung Künstlicher Intelligenz in Schranken regulieren will. Ich hoffe, Europa ist selbstbewusst genug, sich diesem rein marktwirtschaftlich ausgerichteten Vorgehen der USA zu widersetzen, ohne die Möglichkeiten einer Nutzung und Entwicklung von Künstlicher Intelligenz zu stark einzuschränken. Der Einsatz Künstlicher Intelligenz wird gravierende gesellschaftliche Veränderungen nach sich ziehen, sodass es auch erforderlich, gesellschaftlich auf diese Entwicklung zu antworten.

Neben China und den USA kann es Europa durchaus gelingen, beide Schwerpunkte (USA: Kapital getrieben, China: Politik getrieben) zur Nutzung von Künstliche Intelligenz in einem Hybriden Europäischen KI-Ansatz zu verbinden. Das wäre gesellschaftlich eine Innovation, die durchaus für andere Länder weltweit interessant sein könnte.

Open Euro LLM ist beispielsweise so eine Initiative, die durchaus vielversprechend ist. Wie in dem Screenshot zur Website zu erkennen ist, setzt man bei Open Euro LLM auf Offenheit und Transparenz, und auch auf europäische Sprachen in den Trainingsdatenbanken der Large Language Models (LLM). Beispielhaft soll hier der Hinweis auf Truly Open noch einmal herausgestellt werden:

Truly Open
including data, documentation, training and testing code, and evaluation metrics; including community involvement

In Zukunft wird es meines Erachtens sehr viele kleine, spezialisierte Trainingsdatenbanken (SLM: Small Language Models) geben, die kontextbezogen in AI-Agenten genutzt werden können. Wenn es um Kontext geht, muss auch die kulturelle Vielfalt Europas mit abgebildet werden. Dabei bieten sich europäische Trainingsdatenbanken an. Siehe dazu auch

CAIRNE: Non-Profit Organisation mit einer europäischen Perspektive auf Künstliche Intelligenz

Open Source AI-Models for Europe: Teuken 7B – Training on >50% non English Data

Open Source AI Definition – 1.0: Release Candidate 2 am 21.10.2024 veröffentlicht

Open Source AI: Besser für einzelne Personen, Organisationen und demokratische Gesellschaften

AI Agents: Langflow (Open Source) auf unserem Server installiert

Innovationsprojekte: Überwindung von Barrieren durch Promotoren und Gatekeeper

Innovationen zeichnen sich dadurch aus, dass es sich dabei um etwas Neues handelt. Auf dem Weg zu einer Innovation hat ein entsprechendes Projekt (Innovationsprojekt) Widerstände und Barrieren zu überwinden. In diesem Prozess hat es sich bewährt, Promotoren auszumachen, die helfen, diese Barrieren zu überwinden. Das Promotorenmodell von Witte ist hier eine oft erwähnte Hilfestellung. Zusammen mit der Rolle eines Gatekeepers ergeben sich somit die folgenden Schlüsselrollen mit den jeweils typischen Leistungsbeiträgen.

SchlüsselpersonenTypische Leistungsbeiträge
MachtpromotorÜberwinden von „Barriere des Nicht-Wollens“
– Zieldefinition,
– Ressourcenbereitstellung,
– Schutz vor Opponenten,
– Prozesssteuerung
FachpromotorÜberwinden von „Barriere des Nicht-Könnens“, „Barriere des Nicht-Wissens“
– Ideengenerierung,
– Alternativenentwicklung,
– Konzeptevaluierung,
– Implementierung
ProzesspromotorÜberwinden von „Barriere des Nicht-Dürfens“
– Zusammenführung,
– Vermittlung,
– Konfliktmanagement,
– Prozesssteuerung,
– Koordination
BeziehungspromotorÜberwinden von „Barriere des Nicht-Miteinander-Könnens und Nicht-Miteinander-Wollens“
– Informationsaustausch,
– Finden und Zusammenbringen von Interaktionspartnern,
– Koordination,
– Planung und Steuerung von Austauschprozessen,
– Konfliktmanagement
Gatekeeper– Suchen nach und Sammeln von Informationen,
– Filtern von Informationen zur Aufnahme und Ausgabe,
– Informationsaufnahme und -ausgabe,
– Schutz der Organisation vor Informationsüberfluss und externem Druck
Typische Schlüsselpersonen in Innovationsprojekten (Hochbrügge et al 2017, in projektmanagementaktuell 4/2017, verändert nach Gemünden/Hölzle/Lettl (2006)

Solche Zusammenhänge thematisieren wir auch in den von uns entwickelten Blended Learning Lehrgängen Projektmanager/in (IHK) und Projektmanager/in AGIL (IHK). Informationen dazu, und zu aktuellen Terminen, finden Sie auf unserer Lernplattform.

Ist die Verwendung von Persona das Gegenteil von Mass Customization?

Gerade im Agilen Projektmanagement werden Anforderungen häufig für Persona formuliert. Diese sind nach dem IREB (International Requirements Engineering Board) fiktive Charaktere, mit deren Hilfe Werte für die User geschaffen werden sollen. Dieses Vorgehen erinnert an eine Art Segmentierung aus dem traditionellen Marketing.

Mass Customization auf der anderen Seite ist eine hybride Wettbewerbsstrategie, die individuelle Produkte und Dienstleistungen für jeden Abnehmer – also massenhaft – anbietet, bei Preisen, die denen der massenhaft produzierten Standardprodukten ähneln. Dabei ist der Konfigurator ein wichtiges Element, das passende Produkt in einem Fixed Solution Space (Definierter Lösungsraum) zu erstellen. Die dahinterliegende Idee eines “Market of One” passt nicht so recht mit der Persona-Idee zusammen. Dazu habe ich folgendes gefunden:

“In many ways, a persona is the opposite of mass customization. It’s more traditional marketing thinking about how to deal with a larger number of segments. A “persona of one” is turning the persona idea to its opposite” Piller, Frank T. and Euchner, James, Mass Customization in the Age of AI (June 07, 2024). Research-Technology Management, volume 67, issue 4, 2024 [10.1080/08956308.2024.2350919], Available at SSRN: https://ssrn.com/abstract=4887846.

In Zeiten von Künstlicher Intelligenz wird es immer mehr Möglichkeiten geben, Produkte und Dienstleistungen massenhaft zu individualisieren und zu personalisieren. Ob die Verwendung von Persona in solchen eher agil durchzuführenden Projekten dann noch angemessen ist, scheint fraglich zu sein. Siehe dazu auch 

Society 5.0 und Mass Customization

Freund, R. (2009): Kundenindividuelle Massenproduktion (Mass Customization). RKW Kompetenzzentrum, Faktenblatt 5/2009.

Wir sind dabei: 20 Jahre MCP-CE vom 24.-27.09.2024