ڌماڪي جي شروعات لانچ ڪيو مفت لائبريري جو نئون ورزن «اسپي سي»جنهن جي عمل درآمد آهي قدرتي ٻولي پروسيسنگ الگورٿم (اين ايل پي). عملي طور تي منصوبي کي جوابدار بڻائڻ جي ڪم ۾ آڻي سگهجي ٿو، بوٽس ، متن جي درجه بندي ، ۽ مختلف ڊائلاگ سسٽم جيڪي جملن جي معنيٰ بيان ڪن ٿا.
لائبريري مستقل API مهيا ڪرڻ لاءِ ٺهيل آهي اهو استعمال ٿيل الگورتھم سان ڳن linkedيل نه آهي ۽ حقيقي شين ۾ استعمال لاءِ تيار آهي. لائبريري اين ايل پي ۾ تازيون واڌارو ۽ سڀ کان وڌيڪ موثر الگورٿم استعمال ڪندو آهي معلومات جي پروسيسنگ لاءِ موجود.
جيڪڏهن وڌيڪ ڪارائتو الگورتھم ظاهر ٿئي ٿو ، لائبريري هن ڏانهن منتقل ڪئي وڃي ٿي ، پر اهو منتقلي API يا ايپليڪيشنس تي اثر انداز نٿو ڪري.
spaCy جي هڪ خاصيت اهو پڻ هڪ آرڪيٽيڪٽ آهي جنهن کي مڪمل دستاويزن جي پروسيس ڪرڻ لاءِ ، پري پروسیسر ۾ بغير پروسيس کي جيڪا دستاويزن کي جملن ۾ ورهائي ٿي. ماڊل ٻن نسخن ۾ پيش ڪيا ويا آھن: وڌ کان وڌ پيداوار ۽ وڌ کان وڌ درستگي لاءِ.
spaCy جي خاصيتون:
- 60 ٻولين لاءِ مدد
- اڳ ۾ ئي سکيايل ماڊل مختلف ٻولين ۽ ايپليڪيشنن لاءِ دستياب آهن.
- Multitask سکيا اڳوڻي ٽرانسفارمرن وانگر استعمال ڪري رهيو آهي جهڙوڪ BERT (Bidirectional Encoder Renderings of Transformers).
- اڳ-تربيت ٿيل ویکٹر ۽ لفظ سرايت لاءِ مدد.
- اعلي ڪارڪردگي.
- تيار استعمال اندر پڙهائي تي آسان تربيتي نظام جو نمونو.
- لساني طور تي متحرڪ ٽوڪنائزيشن.
- تيار ٿيل حصا نالي وارن ادارن کي ڳن linkڻ ، تقرير جي حصن کي نشان لڳائڻ ، متن کي درجي بندي ڪرڻ ، ٽيگ تي ٻڌل انحصار جو تجزيو ڪرڻ ، جملن کي ورهائڻ ، تقرير جي حصن کي نشان لڳائڻ ، مورفولوجيڪل تجزيا ، اسٽيمنگ وغيره لاءِ موجود آهن.
- ڪسٽم اجزاء ۽ خاصيتن سان گڏ ڪارڪردگي وڌائڻ جي لاءِ سپورٽ.
- پائي ٽيورچ ، ٽينسر فلو ۽ ٻين فريم ورڪ تي ٻڌل توهان جي پنهنجي ماڊل ٺاهڻ لاءِ مدد.
- نالي واري اداري بائننگ ۽ نحو بصري (NER ، نالي وارا ادارا تسليم ٿيل) لاءِ ٺاهيل اوزار.
- پيڪيجنگ ۽ ماڊل ترتيب ڏيڻ جو آسان عمل ۽ ڪم جي فلو کي منظم ڪرڻ.
- وڏي درستگي.
لائبريري پٿن ۾ سائٽن سان عنصرن سان لکيو ويو آهي، هڪ پٿن جي واڌ جيڪا سي سي ٻولي ۾ سڌي ڪم جي ڪال جي اجازت ڏئي ٿي.
منصوبي جو ڪوڊ ايم آءِ ٽي لائسنس تحت ورهايل آهي. 58 ٻولين لاءِ ٻولي جا ماڊل تيار آهن.
spaCy 3.0 جي نئين ورزن بابت
سپاسي 3.0 نسخو ۾ عملدرآمد لاءِ بيٺل آهي ماڊل خاندانَ 18 ٻولين لاءِ بحال ٿيو ۽ 59 پائپ لائنز تربيت يافته مجموعي طور تي ، 5 نئين ٽرانسفارم تي ٻڌل پائپ لائنز شامل آهن
ماڊل ٽن نسخن ۾ پيش ڪيو ويو آهي (16 ايم بي ، 41 ايم بي - 20 هزار ويڪٽر ۽ 491 ايم بي - 500 هزار ویکٹر) ۽ سي پي يو لوڊ جي تحت ڪم ڪرڻ جي اصلاح آهي ۽ شامل آهي ٽوڪ 2 وي سي ، مورفولوجائزر ، پارر ، ايسٽر ، اينئر ، ايٽٽ_رولڊر ، ۽ ليمميٽيزر جزا.
اسان سپا سي وي 3.0 تي ڪم ڪري چڪا آهيون تقريبن هڪ سال کان وٺي ، ۽ تقريبن ٻن سالن جي جيڪڏهن توهان ٿنڪ تي ڪيل سڀ ڪم ڳڻپ ڪريو. لانچ سان اسان جو بنيادي مقصد اهو آهي ته توهان پنهنجي ماڊلز کي SPACY ۾ آڻڻ ۾ آساني ڪندا ، خاص طور تي اسٽيٽ جي جديد ماڊل جهڙوڪ ٽرانسفارمر. توهان ماڊل لکي سگهو ٿا جيڪي سپا سي حصن کي فريم ورڪ وانگر فيورڪ يا ٽينسر فلو ۾ پاليندا آهن ، توهان جي س awesomeي سيٽنگ کي بيان ڪرڻ لاءِ اسان جي بهترين نئين ترتيب واري سسٽم کي استعمال ڪندي. ۽ کان وٺي جديد اين ايل پي ورڪ فلو اڪثر ڪيترن ئي مرحلن تي مشتمل هوندا آهن ، اتي توهان جي ڪم کي منظم رکڻ ۾ مدد لاءِ نئون ورڪ فلو سسٽم آهي.
ٻي اهم جدت اھو نئون ورزن کان ٻاهر
- تربيتي ماڊل لاءِ نئون ڪم فلو.
- نئين ٺاھ جوڙ جو نظام.
- ٽرانسفارم تي ٻڌل پائپ لائنن جي نمونن جي حمايت ، ملائي ڪم ڪرڻ جي سکيا لاءِ مناسب.
- مختلف مشينن جي سکيا جي فريم ورڪ ، جهڙوڪ PyTorch ، TensorFlow ، ۽ MXNet استعمال ڪندي توهان جا پنهنجا ماڊل ڳن toڻ جي صلاحيت.
- ڪم جي وهڪري جي سڀني مرحلن کي منظم ڪرڻ جي لاءِ پراجيڪٽ جي سپورٽ ، اڳئين پروسيسنگ کان وٺي ماڊل تي عمل درآمد تائين.
- ڊيٽا ورژن ڪنٽرول (ڊي وي سي) ، اسٽريمليٽ ، وزن ۽ بيسس ۽ رائي پيڪيجز سان اتحاد جي حمايت.
- نئون تعمير ٿيل حصا: SentenceRecognizer، Morphologizer، Lemmatizer،
- منسوب ڪرڻ وارو اختيار ۽ ٽرانسفارمر.
- توھان جي اجزاء ٺاھڻ لاءِ نئون API.
آخرڪار، جيڪڏهن توهان هن بابت وڌيڪ inاڻڻ چاهيندا ھن نئين ورزن بابت يا اسپا سي جي باري ۾ ، توھان تفصيل چيڪ ڪري سگھو ٿا هيٺين لنڪ ۾.
تبصرو ڪرڻ جو پهريون