최신 OpenAI 모델은 이미 객체를 더 효율적으로 그리고 인식합니다.

OpenAI 연구원은 두 개의 신경망을 개발했습니다. 사용자의 지시에 따라 자연어로 개체를 그리고 높은 정밀도로 이미지를 설명 할 수 있습니다.

프로젝트 그들은 며칠 전에 알려졌다 인공 지능을 적용 할 수있는 작업의 범위를 넓힐뿐만 아니라 정확한 결과를 생성하기 위해 엔지니어가 수동으로 조정할 필요가 적은보다 다양한 모델을 만드는 AI 연구 커뮤니티의 목표를 더욱 강화합니다.

DALL E, 최초의 신경망 새로운, GPT-3 자연어 처리 모델의 축소 버전입니다. OpenAI는 2020 년에 데뷔했습니다. 지금까지 만들어진 가장 복잡한 신경망 중 하나 인 GPT-3는 간단한 설명으로 텍스트와 소프트웨어 코드를 생성 할 수 있습니다. DALL E 사용자가 지시 한대로 이미지를 그리는 것과 동일한 기능을 적용합니다.

모델의 뛰어난 기능은 설명에 대한 응답으로도 이미지를 생성 할 수 있습니다. 처음으로 만나고 AI가 일반적으로 해석하기 어렵습니다.

OpenAI 연구원의 테스트 중 모델이 도면을 성공적으로 생성 할 수 있음을 입증 할 수있었습니다. 이와 같은 설명에 대한 응답으로 모델은 여러 다른 스타일로 이미지를 렌더링 할 수 있습니다.

연구원 d다재다능한 AI가 얼마나 정확한지 테스트하기로 결정했습니다. 다양한 난이도의 몇 가지 추가 작업을 수행하게함으로써

일련의 실험에서이 모델은 여러 각도에서 서로 다른 해상도 수준에서 동일한 이미지를 생성 할 수있는 능력이있어 매우 효율적인 것으로 입증되었습니다.

또 다른 AI 테스트에서는 모델이 생성하도록 요청 된 이미지의 개별 세부 정보를 사용자 지정할 수있을만큼 정교함을 보여주었습니다.

OpenAI 연구원은 블로그 게시물에 "여러 객체, 속성 및 공간 관계를 동시에 제어하는 ​​것은 새로운 도전 과제를 제시합니다."라고 썼습니다. 예를 들어, "빨간 모자를 쓴 고슴도치, 노란 장갑, 파란 셔츠, 녹색 바지"라는 문구를 생각해보십시오. 이 문장을 정확하게 해석하기 위해 DALL E는 동물과 함께 각 의복을 올바르게 구성 할뿐만 아니라 혼합하지 않고 연관성 (모자, 빨강), (장갑, 노랑), (셔츠, 파랑) 및 (바지, 초록)을 형성해야합니다. «.

다른 신경망 최근에 자세한 OpenAI, 클립, 기존 이미지에서 개체 인식에 중점을 둡니다. 새로운 것을 그리는 대신.

이러한 방식으로 이미지를 분류하는 컴퓨터 비전 모델이 이미 있지만 대부분은 특별히 훈련 된 작은 개체 집합 만 식별 할 수 있다는 점에 유의해야합니다.

예를 들어 야생 동물 사진에서 동물을 분류하는 AI는 정확한 결과를 생성하기 위해 많은 야생 동물 사진에 대해 교육을 받아야합니다. Clip과 OpenAI의 차이점 이전에 발견되지 않은 객체에 대한 설명을 작성할 수 있다는 것입니다.

Clip의 다양성은 실험실이 모델을 구축하기 위해 개발 한 새로운 교육 접근 방식의 결실입니다.

훈련 과정에서 OpenAI는 이미지 데이터 세트를 사용하지 않았습니다. 수동으로 그려 지지만 그림 공개 웹 및 첨부 된 텍스트 캡션에서 가져옵니다. 캡션을 통해 Clip은 다양한 유형의 객체와 관련된 광범위한 단어 어휘집을 구축 할 수 있었으며,이를 통해 이전에 본 적이없는 객체를 설명하는 데 사용할 수있었습니다.

"딥 러닝에는 많은 양의 데이터가 필요하며 비전 모델은 구축 비용이 많이 들고 미리 결정된 제한된 수의 시각적 개념에 대해서만 감독을 제공하는 수동 레이블이 지정된 데이터 세트에 대해 학습되었습니다." "대신 CLIP은 이미 인터넷에 공개 된 텍스트 및 이미지 쌍에서 학습합니다."

마지막으로, 그것에 대해 더 알고 싶다면 OpenAI 모델에 대한 자세한 내용을 확인할 수 있습니다 다음 링크에서.


코멘트를 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

*

*

  1. 데이터 책임자 : Miguel Ángel Gatón
  2. 데이터의 목적 : 스팸 제어, 댓글 관리.
  3. 합법성 : 귀하의 동의
  4. 데이터 전달 : 법적 의무에 의한 경우를 제외하고 데이터는 제 XNUMX 자에게 전달되지 않습니다.
  5. 데이터 저장소 : Occentus Networks (EU)에서 호스팅하는 데이터베이스
  6. 권리 : 귀하는 언제든지 귀하의 정보를 제한, 복구 및 삭제할 수 있습니다.