Jump to content

AI computer vision (Objekterkennung auf Fotos)


Recommended Posts

Hi,

mit generativer AI hat auch das sogenannte computer vision Einzug gehalten. Z.B. ist es damit möglich, Fotos beschreiben zu lassen oder auch Objekte und Text darauf zu identifizieren.

Meine Frage wäre, habt ihr Ideen zu Use Cases und könntet diese Beschreiben? Wie könnte das aussehen? Wäre eine beschreibung von Bildern im Bericht sinnvoll? Oder wäre eine Objekterkennung nur in der App nützlich (z.B. erkennen von Nummernschildern oder Schäden an Objekten?

Ich bin gespannt auf eure Ideen. Hier ein Beispiel was jeder mit GPT4 ausprobieren kann.

Eingabe:
image.png.068ba63a8e433cca7699d5f330cefad1.png

describe what food is on the image..

Zitat

The image features a well-balanced meal consisting of a seared piece of salmon, with its skin side up revealing a golden-brown crust, indicating it has been cooked to develop a crispy texture. Accompanying the salmon are whole grain penne pasta, which appears to have been either boiled or sautéed, and a serving of vegetables including sautéed sliced mushrooms and steamed broccoli with a bright green color, suggesting they have been cooked but still retain some crunch. The colors and textures suggest a health-conscious meal, with a focus on lean protein, whole grains, and vegetables.

Man beachte die Details wie die erkannte Vollkorn Paste 😄

Holger

  • Like 3
  • Haha 1
  • Agree 1
Link to comment
Share on other sites

Fotobeschreibung finde ich aktuell noch recht aufwendig. Je detaillierter ein Bild umso wortreicher die Beschreibung.

Aber was Moritz beschrieben hat, finde ich schon eher spannend. Ein Art "Scan2Text". Man identifiziert den Text und lässt das automatisiert in die entsprechenden Bausteine einfließen. 
Das können z.B. bei uns Produktnummer auf Profilen sein, Gestellnummer, etc.. vor allem dann interessant wenn keine Barcodes vorhanden oder schlecht lesbar sind.

  • Like 2
  • Agree 2
Link to comment
Share on other sites

Ja ich merke gerade, mein Impuls geht ein wenig in die falsche Richtung. Das ist ja eine erweiterte bzw. spezifische Object Character Recognition, also Buchstabenerkennung und keine (eher allgemeine) Object Recognition. Also bitte lasst eure Geister nicht durch mein Warrngezümmel hier einschränken... 😅

programming coding GIF

  • Haha 2
Link to comment
Share on other sites

Auch eine falsche Richtung ist eine Richtung... 😀

mistake-that-way.gif

 

Wir hätten durchaus Ansätze in der Fertigung, wenn Kunststoffprofile über die Maschine laufen, die jedes Profil tracken und nach Fehler analysieren.
Mit der KI-basierten Ansatz beschäftigen wir uns bereits schon. Aber an dem Punkt sehe ich keinen smap-Ansatz, da es doch hochgradig automatisiert ablaufen müsste.

Bin auf andere Ideen gespannt....

  • Like 1
  • Agree 2
Link to comment
Share on other sites

Beide Gebiete wären mit Sicherheit spannend.

Scan2Text-Lösungen wären vielleicht interessant für Nummernschilder, Führerscheine, Kilometerstände, Stromzählerstände, Artikel- oder Auftragsnummern. 

Ich könnte mir aber auch Computer Vision vorstellen. Zum Beispiel für Berichte in den Bereichen Betriebsbegehungen/Audits, etc.

  • Like 4
  • Agree 1
Link to comment
Share on other sites

Am 7.2.2024 um 14:21 schrieb HK alias Holger:

Hi,

mit generativer AI hat auch das sogenannte computer vision Einzug gehalten. Z.B. ist es damit möglich, Fotos beschreiben zu lassen oder auch Objekte und Text darauf zu identifizieren.

Meine Frage wäre, habt ihr Ideen zu Use Cases und könntet diese Beschreiben? Wie könnte das aussehen? Wäre eine beschreibung von Bildern im Bericht sinnvoll? Oder wäre eine Objekterkennung nur in der App nützlich (z.B. erkennen von Nummernschildern oder Schäden an Objekten?

Ich bin gespannt auf eure Ideen. Hier ein Beispiel was jeder mit GPT4 ausprobieren kann.

Eingabe:
image.png.068ba63a8e433cca7699d5f330cefad1.png

describe what food is on the image..

Man beachte die Details wie die erkannte Vollkorn Paste 😄

Holger

@Holger KreisslGesichtserkennung bei meiner Frau: In dieser Reihenfolge:  Gut gelaunt, was hast jetzt schon wieder verbrochen, bleib am besten am Schreibtisch. 

  • Haha 8
Link to comment
Share on other sites

  • 3 months later...

Hallo zusammen,
da ich Daten zu technischen Anlagen erfasse, würde es mir sehr helfen, wenn das Typenschild der Anlagen ausgelesen wird. Hersteller, Typ und Baujahr erkennen und in der smap eintragen würde schon eine Zeitersparnis bedeuten.

 

  • Like 3
  • Agree 2
Link to comment
Share on other sites

Please sign in to comment

You will be able to leave a comment after signing in



Sign In Now
×
×
  • Create New...