AI computer vision (Objekterkennung auf Fotos)

HK alias Holger · 7. Februar

Hi,

mit generativer AI hat auch das sogenannte computer vision Einzug gehalten. Z.B. ist es damit möglich, Fotos beschreiben zu lassen oder auch Objekte und Text darauf zu identifizieren.

Meine Frage wäre, habt ihr Ideen zu Use Cases und könntet diese Beschreiben? Wie könnte das aussehen? Wäre eine beschreibung von Bildern im Bericht sinnvoll? Oder wäre eine Objekterkennung nur in der App nützlich (z.B. erkennen von Nummernschildern oder Schäden an Objekten?

Ich bin gespannt auf eure Ideen. Hier ein Beispiel was jeder mit GPT4 ausprobieren kann.

Eingabe:

describe what food is on the image..

Zitat

The image features a well-balanced meal consisting of a seared piece of salmon, with its skin side up revealing a golden-brown crust, indicating it has been cooked to develop a crispy texture. Accompanying the salmon are whole grain penne pasta, which appears to have been either boiled or sautéed, and a serving of vegetables including sautéed sliced mushrooms and steamed broccoli with a bright green color, suggesting they have been cooked but still retain some crunch. The colors and textures suggest a health-conscious meal, with a focus on lean protein, whole grains, and vegetables.

Man beachte die Details wie die erkannte Vollkorn Paste 😄

Holger

Moritz · 7. Februar

Ich hatte bereits einige Creatoren, die eine solche Funktion gerne für Visitenkarten oder Führerscheine nutzen würden. Das ist so das erste, was mir in den Sinn kommt.

Bülent Erbas · 7. Februar

Fotobeschreibung finde ich aktuell noch recht aufwendig. Je detaillierter ein Bild umso wortreicher die Beschreibung.

Aber was Moritz beschrieben hat, finde ich schon eher spannend. Ein Art "Scan2Text". Man identifiziert den Text und lässt das automatisiert in die entsprechenden Bausteine einfließen.
Das können z.B. bei uns Produktnummer auf Profilen sein, Gestellnummer, etc.. vor allem dann interessant wenn keine Barcodes vorhanden oder schlecht lesbar sind.

Moritz · 7. Februar

Ja ich merke gerade, mein Impuls geht ein wenig in die falsche Richtung. Das ist ja eine erweiterte bzw. spezifische Object Character Recognition, also Buchstabenerkennung und keine (eher allgemeine) Object Recognition. Also bitte lasst eure Geister nicht durch mein Warrngezümmel hier einschränken... 😅

Bülent Erbas · 7. Februar

Auch eine falsche Richtung ist eine Richtung... 😀

Wir hätten durchaus Ansätze in der Fertigung, wenn Kunststoffprofile über die Maschine laufen, die jedes Profil tracken und nach Fehler analysieren.
Mit der KI-basierten Ansatz beschäftigen wir uns bereits schon. Aber an dem Punkt sehe ich keinen smap-Ansatz, da es doch hochgradig automatisiert ablaufen müsste.

Bin auf andere Ideen gespannt....

Dominik Gerkens · 8. Februar

Beide Gebiete wären mit Sicherheit spannend.

Scan2Text-Lösungen wären vielleicht interessant für Nummernschilder, Führerscheine, Kilometerstände, Stromzählerstände, Artikel- oder Auftragsnummern.

Ich könnte mir aber auch Computer Vision vorstellen. Zum Beispiel für Berichte in den Bereichen Betriebsbegehungen/Audits, etc.

Sven Zuschlag · 12. Februar

Am 7.2.2024 um 14:21 schrieb HK alias Holger:

Hi,

mit generativer AI hat auch das sogenannte computer vision Einzug gehalten. Z.B. ist es damit möglich, Fotos beschreiben zu lassen oder auch Objekte und Text darauf zu identifizieren.

Meine Frage wäre, habt ihr Ideen zu Use Cases und könntet diese Beschreiben? Wie könnte das aussehen? Wäre eine beschreibung von Bildern im Bericht sinnvoll? Oder wäre eine Objekterkennung nur in der App nützlich (z.B. erkennen von Nummernschildern oder Schäden an Objekten?

Ich bin gespannt auf eure Ideen. Hier ein Beispiel was jeder mit GPT4 ausprobieren kann.

Eingabe:

describe what food is on the image..

Man beachte die Details wie die erkannte Vollkorn Paste 😄

Holger

@Holger KreisslGesichtserkennung bei meiner Frau: In dieser Reihenfolge: Gut gelaunt, was hast jetzt schon wieder verbrochen, bleib am besten am Schreibtisch.

HK alias Holger · 12. Februar

vor 1 Stunde schrieb Sven Zuschlag:

@Holger KreisslGesichtserkennung bei meiner Frau: In dieser Reihenfolge: Gut gelaunt, was hast jetzt schon wieder verbrochen, bleib am besten am Schreibtisch.

Gunnar Mahnke-Sun · 30. Mai

Hallo zusammen,
da ich Daten zu technischen Anlagen erfasse, würde es mir sehr helfen, wenn das Typenschild der Anlagen ausgelesen wird. Hersteller, Typ und Baujahr erkennen und in der smap eintragen würde schon eine Zeitersparnis bedeuten.

AI computer vision (Objekterkennung auf Fotos)

Empfohlene Beiträge

HK alias Holger

Link zu diesem Kommentar

Auf anderen Seiten teilen

Moritz

Link zu diesem Kommentar

Auf anderen Seiten teilen

Bülent Erbas

Link zu diesem Kommentar

Auf anderen Seiten teilen

Moritz

Link zu diesem Kommentar

Auf anderen Seiten teilen

Bülent Erbas

Link zu diesem Kommentar

Auf anderen Seiten teilen

Dominik Gerkens

Link zu diesem Kommentar

Auf anderen Seiten teilen

Sven Zuschlag

Link zu diesem Kommentar

Auf anderen Seiten teilen

HK alias Holger

Link zu diesem Kommentar

Auf anderen Seiten teilen

Gunnar Mahnke-Sun

Link zu diesem Kommentar

Auf anderen Seiten teilen

Bitte melde Dich an, um einen Kommentar zu hinterlassen

Umsehen

Aktivitäten