Meta Platforms Inc.s künstliche Intelligenzforschungsteam hat eine Fortsetzung des beliebten Segment Anything Machine-Learning-Modells veröffentlicht, das letzten Sommer veröffentlicht wurde. Segment Anything 2 wurde heute von Meta-CEO Mark Zuckerberg während eines breit gefächerten Gesprächs mit Nvidia Corp. CEO Jensen Huang bei der Veranstaltung SIGGRAPH 2024 angekündigt. Es handelt sich um eine signifikante Verbesserung des Originalmodells, das darauf ausgelegt war, spezifische Objekte und Dinge innerhalb eines Bildes zu identifizieren, und diese Fähigkeit nun auch auf Videos überträgt.
SA2, wie es genannt wird, ist ein “Segmentationsmodell”, das eine spezielle Art von Computer-Vision-Modell darstellt, das ein Bild betrachten und beschreiben kann, was es sieht. Es kann beispielsweise einen teilweise von einem Baum verdeckten Hund oder einen Eimer, der Regenwasser von einem undichten Dach sammelt, identifizieren. Der Unterschied zwischen SA1 und SA2 besteht darin, dass letzteres auf Videos angewendet werden kann, nicht nur auf Bilder, was einen bedeutenden Fortschritt für die Computer-Vision-Branche darstellt.
Das SA2-Modell wird als Open Source veröffentlicht und kann von GitHub heruntergeladen werden, und es gibt hier eine kostenlose Demo. Zuckerberg sagte, dass das Modell auf einer enormen Menge an Daten trainiert wurde, und das Unternehmen hat eine annotierte Datenbank von etwa 50.000 Videos veröffentlicht, die speziell zum Training von SA2 erstellt wurde. Während er nicht sagte, warum, ist es vernünftig anzunehmen, dass diese Videos höchstwahrscheinlich von Benutzern generierte Inhalte von Facebook und Instagram sind.
Holger Mueller von Constellation Research Inc. sagte, dass die Veröffentlichung von SA 2 eine rechtzeitige Erinnerung an die beeindruckenden Fortschritte ist, die die generative KI in Bezug auf Bildgenerierung, -bearbeitung und -verständnis gemacht hat. Während des Gesprächs sprach Zuckerberg auch über seine Vision einer Zukunft, in der Facebook und Instagram möglicherweise KI-Doppelgänger von Social-Media-Influencern und Content-Erstellern generieren könnten, die wie “ein Agent oder Assistent wirken, mit dem ihre Community interagieren kann.”
Meta’s ultimatives Ziel dabei ist es, alle Inhalte eines Benutzers schnell zusammenzustellen und eine Art Geschäftsagenten zu schaffen, um “mit Ihren Kunden zu interagieren und Verkauf und Kundensupport zu betreiben”.
Hinterlasse eine Antwort