OpenAI-ийн шинэ загварууд объектуудыг илүү үр дүнтэй зурж, таньдаг болсон

OpenAI судлаачид хоёр мэдрэлийн сүлжээг боловсруулсан Тэд хэрэглэгчийн зааврын дагуу объектыг байгалийн хэлээр зурж, дүрсийг өндөр нарийвчлалтай дүрслэх боломжтой.

Төслүүд тэд хэд хоногийн өмнө танил болсон хиймэл оюун ухааныг хэрэгжүүлж болох ажлуудын цар хүрээг өргөжүүлэх, хиймэл оюун ухааны судалгааны олон нийтийн зорилго, инженерчлэлээс илүү бага гарын авлагын тохируулга шаарддаг нарийвчлалтай үр дүнг бий болгох олон талт загварыг бий болгох зорилтыг улам ахиулах.

DALL E, анхны мэдрэлийн сүлжээ шинэ, нь байгалийн хэл боловсруулах GPT-3 загварын жижигрүүлсэн хувилбар юм OpenAI нь 2020 онд нээлтээ хийсэн. Өнөөдрийг хүртэл бүтээсэн хамгийн төвөгтэй мэдрэлийн сүлжээнүүдийн нэг GPT-3 нь энгийн тайлбараас текст, тэр ч байтугай програм хангамжийн кодыг гаргаж чаддаг. DALL E хэрэглэгчийн зааврын дагуу зураг зурах чадварыг ашигладаг.

Загварын гайхалтай чадвар нь үүнд оршино тодорхойлолтын хариуд ч зураг гаргаж чаддаг Энэ нь анх удаа таарч байгаа бөгөөд хиймэл оюун ухааныг тайлбарлахад ихэвчлэн хэцүү байдаг.

OpenAI судлаачдын туршилтын явцад загвар нь зургийг амжилттай бүтээж чаддаг гэдгийг тэд харуулж чадлаа гэх мэт тодорхойлолтуудын хариуд загвар нь хэд хэдэн өөр хэв маягаар дүрслэх чадвартай байдаг.

Судлаачид dхиймэл оюун ухаан яг хэр зэрэг байгааг тест хийхээр шийдсэн түүнд янз бүрийн бэрхшээлтэй хэд хэдэн нэмэлт даалгаврыг гүйцэтгүүлэх замаар.

Цуврал туршилтаар загвар нь өндөр үр ашигтай болох нь олон өнцгөөс, ижил түвшний нарийвчлалтай ижил дүрсийг үүсгэх чадвартай болохыг батлав.

Өөр нэг хиймэл оюун ухааны сорил нь загвар нь бүтээхийг хүссэн зурагныхаа нарийн ширийн зүйлийг өөрчлөхөд хангалттай боловсронгуй болохыг харуулсан.

"Олон объект, тэдгээрийн шинж чанар, тэдгээрийн орон зайн харилцааг нэгэн зэрэг хянах нь шинэ сорилтыг бий болгож байна" гэж OpenAI судлаачид блогтоо бичжээ. "Жишээлбэл," улаан малгай, шар бээлий, цэнхэр цамц, ногоон өмдтэй зараа "гэсэн хэллэгийг авч үзье. Энэ өгүүлбэрийг зөв тайлбарлахын тулд DALL · E нь амьтантай хамт хувцас бүрийг зөв зохиохоос гадна (малгай, улаан), (бээлий, шар), (цамц, цэнхэр), (өмд, ногоон) холбоосыг холихгүйгээр бүрдүүлэх ёстой. «.

Нөгөө мэдрэлийн сүлжээ саяхан дэлгэрэнгүй OpenAI, Клип, одоо байгаа зураг дээрх объектыг танихад анхаарлаа төвлөрүүлдэг шинэ зураг зурахын оронд.

Зургийг ийм байдлаар ангилдаг компьютерын алсын хараатай загварууд аль хэдийн байдаг боловч тэдгээрийн ихэнх нь зөвхөн тусгайлан сургагдсан жижиг объектуудыг тодорхойлж чаддаг гэдгийг анхаарах нь чухал юм.

Жишээлбэл, зэрлэг ан амьтдын зураг дээр амьтдыг ангилдаг хиймэл оюун ухааныг олон тооны зэрлэг ан амьтдын зураг дээр сургаж, зөв ​​үр дүн гаргах хэрэгтэй. Клипийг OpenAI-ээс юугаараа ялгадаг вэ Өмнө нь олж чадаагүй объектын тодорхойлолтыг бий болгох чадвартай байх явдал юм.

Clip-ийн олон талт байдал нь загварыг бий болгох лабораторийн боловсруулсан сургалтын шинэ хандлагын үр дүн юм.

Сургалтын явцад OpenAI нь зургийн өгөгдлийн багцыг ашиглаагүй болно гараар зурсан, гэхдээ зураг нийтийн вэбсайт болон түүнд хавсаргасан текстийн тайлбараас авсан болно. Тайлбар нь Clip-т өөр өөр төрлийн объектуудтай холбоотой үгсийн өргөн толь бичиг үүсгэх боломжийг олгож, дараа нь урьд өмнө харж байгаагүй объектуудыг дүрслэхэд ашиглаж болох холбоодууд.

"Гүнзгийрүүлэн сурахад их хэмжээний мэдээлэл шаардагддаг бөгөөд алсын хараатай загваруудыг гар аргаар шошготой бүтээхэд үнэтэй, урьдчилан тогтоосон хязгаарлагдмал тооны харааны ойлголтыг хянах боломжтой өгөгдлийн багц дээр уламжлал болгон сургаж ирсэн" Клип. "Харин ч CLIP нь интернетэд нийтэд нээлттэй байгаа текст, зургийн хосоос суралцдаг."

Эцэст нь, Хэрэв та энэ талаар илүү ихийг мэдэхийг хүсч байвал OpenAI загваруудын талаар та дэлгэрэнгүй мэдээллийг шалгаж болно Дараах холбоос дээр.


Нийтлэлийн агуулга нь бидний зарчмуудыг баримталдаг редакцийн ёс зүй. Алдааны талаар мэдээлэхийн тулд товшино уу энд байна.

Сэтгэгдэл бичих эхний хүн бай

Сэтгэгдэлээ үлдээгээрэй

Таны и-мэйл хаяг хэвлэгдсэн байх болно. Шаардлагатай талбарууд нь тэмдэглэгдсэн байна *

*

*

  1. Мэдээллийг хариуцах: Мигель Анхель Гатан
  2. Мэдээллийн зорилго: СПАМ-ыг хянах, сэтгэгдлийн менежмент.
  3. Хууль ёсны байдал: Таны зөвшөөрөл
  4. Мэдээллийн харилцаа холбоо: Хуулийн үүргээс бусад тохиолдолд мэдээллийг гуравдагч этгээдэд дамжуулахгүй.
  5. Өгөгдөл хадгалах: Occentus Networks (ЕХ) -с зохион байгуулсан мэдээллийн сан
  6. Эрх: Та хүссэн үедээ мэдээллээ хязгаарлаж, сэргээж, устгаж болно.