spaCy, raibhurari yekugadzirisa mutauro raibhurari

Kuputika AI kwakaburitsa kuvhurwa kwe iyo itsva vhezheni yemahara raibhurari «SpaCy»Iyo ine kuiswa kwe mutauro wechisikigo kugadzirisa algorithms (NLP). Mukuita, chirongwa chinogona kushandiswa kuvaka autoresponders, bots, zvinyorwa zvinyorwa, uye akasiyana dialog masisitimu ayo anoona zvinoreva zvirevo.

Raibhurari yakagadzirirwa kupa inoenderera API Izvo hazvibatanidzwe nemaalgorithms anoshandiswa uye akagadzirira kushandisa mune chaiwo zvigadzirwa. Raibhurari inoshandisa kufambira mberi kwazvino muNLP uye maalgorithms anoshanda zvakanyanya inowanikwa kugadzirisa ruzivo.

Kana algorithm inoshanda zvakanyanya ikaonekwa, raibhurari inopfuudzwa kwairi, asi shanduko iyi haikanganisa iyo API kana kunyorera.

Chinhu che spaCy iri zvakare chivakwa chakagadzirirwa kugadzirisa zvakakwana magwaro, pasina kufanotungamira muzvigadziri zvinopatsanura gwaro muzvikamu. Models dzinopihwa mushanduro mbiri: yehuwandu hwekugadzira uye hwakanyanya kunyatsoita.

Iwo makuru maficha e spaCy:

  • Tsigiro yemitauro ingangosvika makumi matanhatu.
  • Dzave dzakadzidziswa mamodheru anowanikwa emitauro dzakasiyana uye zvinoshandiswa.
  • Kudzidzira kweMultitask uchishandisa vashanduri vakadzidziswa seBERT (Bidirectional Encoder Renderings yeTransformers).
  • Tsigiro yeavo-akadzidziswa maveji uye emadziro emashoko
  • Kuita kwepamusoro.
  • Yakagadzirira-kushandisa-pa-iyo-basa kudzidzisa system modhi.
  • Ruzivo rwechimiro rwechiratidzo.
  • Zvigadzirwa zvakagadzirwa zviripo zvekubatanidza mazita ane mazita, kumaka zvikamu zvekutaura, kupatsanura zvinyorwa, kuongorora tag-based kutsamira, kupatsanura mitsara, kutara zvikamu zvekutaura, morphological ongororo, kudzika, nezvimwe.
  • Tsigiro yekuwedzera mashandiro neyakajairika zvinhu uye hunhu.
  • Tsigiro yekugadzira yako mamodheru zvinoenderana nePyTorch, TensorFlow uye mamwe marongero.
  • Zvishandiso zvakavakirwa-mukati zveZita Rinonzi Bhizimusi Rinosunga uye Syntax Kuona (NER, Inonzi Inisiti Kuzivikanwa).
  • Nyore maitiro ekurongedza uye kuendesa mamodheru uye kugadzirisa kufambiswa kwebasa.
  • Kukwirira kwepamusoro.

Raibhurari yakanyorwa muPython ine zvinhu muCyton, yekuwedzera kwePython iyo inobvumira yakanangana nebasa kudana muC mutauro.

Iyo kodhi yeprojekiti inogoverwa pasi peMIT rezinesi. Mhando dzemitauro dzakagadzirira mitauro makumi mashanu neshanu.

Nezve iyo nyowani vhezheni yespaCy 3.0

Iyo spaCy 3.0 vhezheni inomiririra kuitiswa kwe modhi mhuri kudzidziswazve mitauro 18 uye Mapaipi 59 akadzidziswa yakazara, kusanganisira mashanu matsva-akachinja mapaipi

Iyo modhi inopihwa mushanduro nhatu (16 MB, 41 MB - zviuru makumi maviri zvevhenekeri uye 20 MB - mazana mashanu emaveji) uye yakagadzirirwa kushanda pasi peCPU mutoro uye inosanganisira iyo tok2vec, morphologizer, parser, sender, ner, hunhu_ruler, uye lemmatizer zvinoriumba.

Tave tichishanda pa spaCy v3.0 kweinopfuura gore, uye angangoita makore maviri kana iwe ukaverenga rese basa rakaitwa pa Thinc. Chinangwa chedu chikuru nekutanga ndechekuti zviite nyore kuunza ako mamodheru muSpacy, kunyanya mamiriro-e-iyo-emhando mamodheru senge maTransformer. Iwe unogona kunyora mamodheru ayo anofudza iyo spaCy zvinhu muzvimiro senge PyTorch kana TensorFlow, uchishandisa yedu inotyisa nyowani yekumisikidza sisitimu kutsanangura ako ese marongero. Uye sezvo yazvino NLP mafashama emvura anowanzo kuve nematanho akati wandei, pane nyowani yekufambisa system yekukubatsira kuti uchengete basa rako rakarongeka.

Zvimwe zvakakosha zvakagadzirwa izvo zvinobuda mushanduro nyowani:

  • Nyowani yekufambisa yekudzidzira yemamodeli.
  • Nyowani yekumisikidza system.
  • Tsigiro yeanoshandura-anoteedzera mapaipi mamodheru, akakodzera kudzidza kwakawanda.
  • Iko kugona kwekubatanidza yako wega mamodheru uchishandisa akasiyana muchina kudzidza masisitimu, senge PyTorch, TensorFlow, uye MXNet.
  • Rutsigiro rweProjekti kugadzirisa matanho ese ekufambisa kwemvura, kubva pre-kugadzirisa kusvika pakuitwa kwemodheru.
  • Tsigiro yekubatanidzwa neData Shanduro Kudzora (DVC), Streamlit, Weights & Biases uye mapakeji eRay.
  • Zvitsva zvakavakirwa-mukati zvinhu: SentenceRecognizer, Morphologizer, Lemmatizer,
  • AttributeRuler uye Shanduko.
  • New API yekugadzira zvako zvikamu.

Pakupedzisira, kana iwe uchifarira kuziva zvakawanda nezvazvo yeiyi vhezheni nyowani kana nezve spaCy, unogona kutarisa ruzivo Mune inotevera chinongedzo.


Izvo zviri muchinyorwa zvinoomerera pamisimboti yedu ye tsika dzekunyora. Kuti utaure chikanganiso tinya pano.

Iva wekutanga kutaura

Siya yako yekutaura

Your kero e havazobvumirwi ichibudiswa.

*

*

  1. Inotarisira iyo data: Miguel Ángel Gatón
  2. Chinangwa cheiyo data: Kudzora SPAM, manejimendi manejimendi.
  3. Legitimation: Kubvuma kwako
  4. Kutaurirana kwedata
  5. Dhata yekuchengetedza: Dhatabhesi inobatwa neOccentus Networks (EU)
  6. Kodzero: Panguva ipi neipi iwe unogona kudzora, kupora uye kudzima ruzivo rwako