Meta, 판도를 바꾸는 객체 감지 AI 모델 'SAM'과 비교할 수 없는 데이터 세트 공개
Facebook의 모회사인 Meta는 인공 지능 세계에 대한 최신 진출을 발표했습니다. "Segment Anything Model"이라고 불리는 Meta의 새로운 AI 모델은 이미지나 비디오 내의 개별 객체를 놀랄 만큼 정확하게 식별하고 격리할 수 있습니다.
Meta에 따르면 "Segment Anything 모델"은 단순한 도구 그 이상입니다. 콘텐츠 제작 및 사진 편집을 위해; 이는 우리가 주변 세계를 보고 상호 작용하는 방식을 잠재적으로 변화시킬 수 있습니다. 이미지 내의 개별 개체를 식별하는 이 도구의 기능은 AR(증강 현실)에서 과학 연구에 이르는 산업에 다양한 가능성을 열어줍니다.
Meta는 새로운 AI 모델을 공개하는 것 외에도 획기적인 이미지 주석 데이터세트입니다. Meta가 가장 포괄적이라고 주장하는 이 데이터세트에는 일상적인 가정용품부터 복잡한 과학 이미지에 이르기까지 광범위한 개체와 시나리오에 대한 주석이 포함되어 있습니다.
Meta의 SAM AI 모델은 보유한 개체를 인식할 수 있습니다. 훈련받지 않았습니다.
SAM의 차별화되는 점은 훈련받지 않은 개체를 식별하는 능력으로 시장의 다른 AI 모델보다 우위를 점한다는 점입니다. 사용자는 SAM의 간단하고 사용자 친화적인 인터페이스를 사용하여 항목을 누르거나 텍스트 프롬프트에 응답하여 동영상이나 이미지 내의 항목을 선택할 수 있습니다.
최근 시연에서 새로운 AI 도구는 사진을 통해 테스트되었습니다. 여러 마리의 고양이가 들어있습니다. 도구가 개체를 얼마나 정확하게 식별할 수 있는지 확인하기 위해 사용자는 프롬프트로 "cat"이라는 단어를 입력하기만 하면 됩니다. 몇 초 만에 이 도구는 사진 속의 각 고양이 주위에 상자를 그려서 물체를 쉽게 식별하는 놀라운 능력을 보여주었습니다.
또한 읽기: Say Hello To Chat GPT 4 – 더 똑똑한 AI Bot
SAM은 어떻게 작동하나요?
SAM은 새로운 데이터세트에 대해 제로샷 및 퓨샷 학습을 수행할 수 있는 기반 모델입니다. 프롬프트 기술을 사용하여 작업을 수행합니다. 모델은 전경/배경 점, 대략적인 상자, 마스크 및 자유 형식 텍스트를 포함하여 모든 프롬프트에 대해 유효한 분할 마스크를 반환할 수 있습니다. 모델은 주석자가 SAM을 대화형으로 사용할 수 있도록 웹 브라우저의 CPU에서 실시간으로 실행되어야 합니다. SAM은 이미지 인코더, 경량 인코더 및 경량 디코더를 사용하여 단 50밀리초 내에 분할 마스크를 예측합니다. 웹 브라우저에 메시지가 표시될 경우.
SAM에 대해 메타가 말하는 내용
사진에 태그를 지정하려면 금지된 자료를 검토하고 Instagram 및 Facebook의 사람들에게 게시물을 제안하세요. , 회사는 SAM과 유사한 기술을 사용해 왔습니다. SAM의 출시로 이러한 기술에 대한 액세스가 더 많은 사람들에게 확대될 것입니다. 새로운 AI 모델과 데이터 세트는 비상업적 라이선스에 따라 회사 웹사이트에서 다운로드할 수 있습니다. 데모 신청자는 이미지를 업로드할 때 연구 목적으로만 도구를 사용하는 데 동의해야 합니다.
게다가 SAM 모델은 과학 연구에 잠재적으로 응용될 수 있습니다. 이는 연구자가 우주나 지구에서 발생하는 자연 현상의 비디오 녹화에서 특정 물체나 동물을 식별하고 모니터링하는 데 도움이 될 수 있습니다.
이러한 최신 기술 뉴스, 목록, 문제 해결 가이드, 팁 및 요령에 대한 자세한 내용은 다음과 같습니다. Windows, Android, iOS, macOS는 , Pinterest에서 우리를 팔로우하세요.
읽기: 2