Лидерът на SFC иска да отмени термина „AI с отворен код“

Дефиниция на AI с отворен код на OSI

Преди няколко дни SFC официализира новата си дефиниция за „изкуствен интелект с отворен код“ към които Брадли М. Кун, лидер на Software Freedom Conservancy (SFC), е изразил загриженост относно посоченото определение.

Кун споменава, че неговата намерение за анулиране на този срок това е защото Настоящите критерии за „отворен AI“ може да имат сериозни последствия чрез размиване на стойността на термина „отворен код“ и разделяне на общността. Една от точките, които генерират конфликт, е изключването на изискването за публикуване на данните, използвани за обучение на AI модели.

И според OSI включването на това изискване би направило невъзможно повечето текущи езикови модели да се считат за отворени, тъй като техните данни за обучение са предимно частни.

Kuhn счита, че това определение е одобрено набързо, без същия изчерпателен и дълъг процес, който даде определение на традиционния "отворен код". Според него OSI трябваше да квалифицира това ново ръководство като „препоръка“, а не като „дефиниция“, като се има предвид, че системите за изкуствен интелект все още са в ранен етап на развитие.

Обобщението тук, по мое мнение, е просто: OSAID не изисква публична възпроизводимост на научния процес на изграждане на тези системи, тъй като не установява достатъчни изисквания за лицензиране и публично разкриване на комплекти за обучение за така наречения „отворен код“ системи. OSI отказа да добави това изискване поради основен пропуск в своя процес; Те решиха, че „няма смисъл да се публикува дефиниция, на която никоя съществуваща AI система не може да отговори в момента“.

От своя страна OSI твърди, че определението ще помогне да се избегне двусмислената употреба на термина "отворен" в контекста на AI, тъй като много производители етикетират своите модели като отворени само защото позволяват достъп до определени компоненти, като коефициенти на тегло, но ограничават използването им или не разкриват всички подробности за изпълнението.

La OSI установи, че една отворена AI система трябва само да предлага информация подробна информация за данните, използвани във вашето обучение, без да се изисква данните да бъдат публични. Кун обаче вярва, че това ограничение пречи на AI моделите да отговарят на възпроизводимостта, необходима в софтуера с отворен код, където пълният достъп до данни и код е от съществено значение.

В своята критика Кун споменава, че чрез заобикаляне на достъпа към данните за обучението, OSI е стеснил определението до чисто технологичен подход, без да признае AI като цялостна и възпроизводима система, което според него е в противоречие с принципите на отворения код.

Наистина не знам със сигурност (все още) дали единственият начин да се зачитат потребителските права в поддържана от LLM генеративна AI система е да се използват само набори за обучение, които са публично достъпни и са лицензирани под лицензи за безплатен софтуер. Мисля, че това е идеалният и предпочитан начин за модифициране на тези системи.

La определение за „отворена AI система“ одобрен от OSI предизвика противоречия тъй като гарантира само две от четирите свободи основен софтуер с отворен код: възможност за използване и разпространение. Въпреки това, свободите за изучаване и модифициране на модела не са напълно гарантирани, главно поради липсата на достъп до данни за обучение. Този пропуск също така усложнява откриването на възможни задни вратички, вмъкнати в AI модели.

От гледна точка на OSI, Ограничението за публикуване на данни се разбира, тъй като често се дължи на фактори извън контрола на разработчиците, като защита на поверителни данни, авторски права или лицензионни споразумения с трети страни. Въпреки това критиците, включително Брадли Кун и членовете на общността на Debian, твърдят, че тези предизвикателства не оправдават определение, което отслабва принципите на отворения код. Според тях липсата на достъп до данни за обучение намалява стойността на отворения AI и заплашва да размие значението и целостта на движението с отворен код.

Kuhn споменава, че планира да участва в предстоящите избори за ръководство на OSI да се опита да отмени това определение и да насърчи класифицирането му само като препоръка, а не като стандарт. Освен това други организации като Open Source Foundation разработват собствена дефиниция за безплатен AI, която ще включва изискване за наличност на данни, въпреки че признава етични изключения за определени видове данни, като медицински или лични данни.

Накрая ако се интересувате да научите повече за това, можете да проверите подробностите В следващия линк.