LAION 및 Open Assistant: 이들은 무엇이며 둘 다에 대해 더 많은 정보가 있습니까?
작년부터 올 한해 동안 인공 지능 기술 분야와 관련된 기술 혁신에 대해 즐겁고 적절하게 공유했습니다. 이러한 이유로 우리는 다음과 같은 주제에 일부 출판물을 바쳤습니다. «가장 잘 알려지고 사용되는 인공 지능 오픈 소스 AI» y «인공 지능 프로젝트 2023: 자유롭고 자유롭고 개방적인». 그리고 최근에는 웹사이트, 데스크톱 및 터미널 클라이언트 또는 웹 브라우저 애드온 형태의 웹 챗봇의 특정 프로젝트와 관련된 일부가 있습니다.
그러나 이 특별한 경우에 우리는 이 분야에서 기여할 것이 많은 조직과 웹 챗봇에 대해 이야기할 것입니다. 무엇보다도 왜냐하면 오픈 소스 철학의 사용에 열심히 걸다 당신의 목표를 달성하기 위해. 그리고 이것들은 «LAION 조직과 오픈 어시스턴트 웹 챗봇».
인공 지능: 가장 잘 알려져 있고 가장 많이 사용되는 오픈 소스 AI
그리고 당신이 아직도 그것이 무엇인지 알지 못하는 사람들 중 하나라면 인공 지능 프로젝트 및 개발 일반적으로 다음 사항을 다시 명확히 하는 것이 중요합니다.
인공지능 기술은 인공지능을 기반으로 하는 기술이다. 인간 지능 프로세스 시뮬레이션 기계, 특히 컴퓨터 시스템. 이러한 프로세스에는 학습이 포함됩니다., 추리 그리고 자기 교정. 게다가, AI의 특정 응용 프로그램에는 전문가 시스템 및 정보 기술의 사용이 포함됩니다. 인식 음성 및 인공 시력. 인공 지능: 가장 잘 알려지고 가장 많이 사용되는 오픈 소스 AI

LAION 조직 및 Open Assistant 웹 챗봇 소개
LAION 조직이란?
에 따르면 공식 웹 사이트 by LAION, 이 조직은 다음과 같이 설명합니다.
인공지능의 대규모 개방형 네트워크 구축을 찬성하는 조직. 진정한 개방형 조직, 100% 비영리 및 100% 무료. 따라서 기계 학습 연구를 활성화하기 위한 데이터 세트, 도구 및 모델을 제공합니다. 기존 데이터 세트 및 모델을 재사용하여 공개 공교육 및 보다 환경 친화적인 자원 사용을 촉진합니다.
또한, 다른 중요한 데이터 그것에 대해 다음과 같습니다.
그들의 주요 목표는 개방형 데이터 세트, 코드 및 기계 학습 모델을 공개하고 대규모 ML 연구 및 데이터 관리의 기본을 가르치는 것입니다. 이를 위해 그들은 재사용 가능한 모델, 데이터 세트 및 코드를 생성하는 데 중점을 두어 항상 처음부터 생성된 개발을 교육해야 하는 필요성을 피하거나 완화합니다. 이러한 방식으로 에너지 및 컴퓨팅 리소스의 효율적인 사용을 촉진하여 기후 변화 문제에 대처합니다. 그리고 이 목표를 달성하기 위해 기부금과 공공 연구 보조금을 통해 자금을 조달합니다.
그리고 지금은 다음과 같습니다. 주요 프로젝트 다른 많은 모델과 다양한 도구 중에서 다음을 만들었습니다.
- LAION-400M: 공개 액세스 하에 있는 400억 개의 텍스트-이미지 쌍 데이터 세트.
- LAION5B: CLIP에 의해 필터링된 5850억 XNUMX천만 개의 이미지-텍스트 쌍으로 구성된 데이터 세트로, 다양한 최근접 이웃 인덱스, 탐색 및 하위 설정을 위한 개선된 웹 인터페이스, 워터마킹, NSFW 및 독성 콘텐츠 감지를 위한 감지 점수를 특징으로 합니다.
- LAION-코코넛: LAION600B-en의 BLIP을 사용하여 생성된 2억 개의 자막 데이터셋입니다.
- LAION 번역: LAION3B 번역 예시의 5B 데이터셋입니다.
- 클립 H/14: 세계 최대의 오픈 소스 클립.
에 더 해당 조직 및 해당 오픈 소스 프로젝트에 대한 정보는 해당 조직에서 액세스할 수 있습니다. GitHub 섹션.

Open Assistant 웹 챗봇이란 무엇입니까?
에 따르면 공식 웹 사이트 오픈 어시스턴트(OA), 이 웹 챗봇은 다음과 같이 설명됩니다.
단일 고급 소비자 GPU에서 실행할 수 있는 대규모 언어 모델을 만드는 것이 비전인 오픈 소스 채팅 기반 AI 비서입니다. 일부 수정을 통해 Open Assistant가 다른 타사 응용 프로그램과 쉽게 상호 작용할 수 있을 뿐만 아니라 데이터베이스 및 인터넷에서 정보를 검색할 수도 있습니다.
또한 이에 대한 다른 중요한 정보는 다음과 같습니다.
- 다음을 통해 프로젝트에 등록, 사용 및 기여할 수 있습니다. 링크.
- OA는 LAION 조직이 조직하고 전 세계 자원봉사자 팀이 개발한 프로젝트입니다.
- 현재 그들은 OA에 사용할 수 있는 공개 API가 없으므로 타사에서 다른 프로젝트에 사용할 수 있습니다.
- OA가 작동하도록 하기 위해 개발에서는 다음 기술을 사용합니다. 데이터 수집 애플리케이션용 Python 백엔드용 FastAPI 및 추론 백엔드. 반면 인터페이스는 NextJS 및 Typescript로 구축됩니다. 또한 ML 코드베이스는 PyTorch를 기반으로 하며 HuggingFace Transformers와 Accelerate, DeepSpeed, Bitsandbytes, NLTK 및 기타 라이브러리를 사용합니다.
- 모든 OA 코드는 Apache 2.0 라이선스에 따라 라이선스가 부여되므로 상업적인 용도를 포함하여 다양한 용도로 사용할 수 있습니다. 동안, OA Pythia 기반 중고 모델은 Apache License 2.0에 따라 라이선스가 부여되며 OA LLaMa 기반 모델은 Target Company(Facebook) 소유라는 점에서 라이선스 제한과 함께 출시됩니다. 마지막으로 OA 데이터는 상업적 사용을 포함하여 광범위한 사용을 허용하는 크리에이티브 커먼즈 라이선스에 따라 공개됩니다.
이 오픈 소스 프로젝트에 대한 자세한 내용은 공식 문서, FAQ 섹션 y GitHub 섹션.

개요
요컨대, 우리는 둘 다 «오픈 어시스턴트 웹 챗봇으로서의 LAION 조직» 시간이 지남에 따라 인공 지능 분야의 발전뿐만 아니라 오픈 소스 소프트웨어의 부상과 사용, 또한 무료 소프트웨어. 그리고 인공 지능 웹 챗봇이 얼마나 많은지, 특히 공개되고 무료일 때 테스트하는 것을 좋아하는 사람이라면 OA 개발에 참여하고 의견을 통해 경험을 공유하도록 초대합니다. 같은.
그리고 이 포스팅이 마음에 드셨다면 다른 사람들과 공유하는 것을 멈추지 마십시오. 즐겨찾는 웹사이트, 채널, 소셜 네트워크 또는 메시징 시스템의 그룹 또는 커뮤니티. 마지막으로 기억하세요. 우리의 홈 페이지를 방문 en «리눅스에서» 더 많은 뉴스를 탐색합니다. 또한 공식 채널에 가입하십시오. FromLinux 텔레그램, 서쪽 그룹 오늘의 주제에 대한 자세한 내용은