{"id":796,"date":"2023-09-10T21:33:31","date_gmt":"2023-09-10T21:33:31","guid":{"rendered":"https:\/\/sciencesetrecherches.eu\/?p=796"},"modified":"2023-09-11T13:42:04","modified_gmt":"2023-09-11T13:42:04","slug":"le-modele-ia-le-plus-puissant-au-monde","status":"publish","type":"post","link":"https:\/\/sciencesetrecherches.eu\/?p=796","title":{"rendered":"le mod\u00e8le IA le plus puissant au monde"},"content":{"rendered":"\n<div id=\"wp-block-themeisle-blocks-circle-counter-625ed4f5\" data-percentage=\"50\" data-duration=\"2\" data-height=\"100\" data-stroke-width=\"10\" class=\"wp-block-themeisle-blocks-circle-counter\"><div class=\"wp-block-themeisle-blocks-circle-counter-title__area\"><span class=\"wp-block-themeisle-blocks-circle-counter-title__value\">Skill<\/span><\/div><div class=\"wp-block-themeisle-blocks-circle-counter__bar\"><\/div><\/div>\n\n\n\n<p class=\"wp-block-paragraph\">Cerebras et Abu Dhabi construisent le mod\u00e8le d&#8217;IA en langue arabe le plus puissant au monde<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p class=\"wp-block-paragraph\">https:\/\/auth.inceptioniai.org\/realms\/IIAI_CHAT\/protocol\/openid-connect\/auth?client_id=4kcbas7ohjr2c9qg3ze5dp1ni8tmvfwx&#038;redirect_uri=https:\/\/arabic-gpt.ai\/&#038;response_type=code&#038;scope=openid&#038;state=deb8cb2d155e40cb940df1d832736788&#038;code_challenge=wtKLRelHYfkMth_L6-6WFrAdPXzxVLL6L60xuTvX_kM&#038;code_challenge_method=S256&#038;response_mode=query<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n<\/blockquote>\n\n\n\n<p class=\"wp-block-paragraph\"><em>Jais-Chat, nomm\u00e9 d&#8217;apr\u00e8s la plus haute montagne des \u00c9mirats arabes unis<\/em><em>, peut prendre un message en arabe ou en anglais et compl\u00e9ter la phrase, tout comme le fait Chat-GPT. Tiernan Ray + DreamStudio de Stability.ai<\/em><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Signe des temps \u00e0 venir, la startup Cerebras Systems vient d&#8217;annoncer une association avec Inception, une filiale de la soci\u00e9t\u00e9 d&#8217;investissement G42 des \u00c9mirats arabes unis. L&#8217;id\u00e9e est de cr\u00e9er le plus grand mod\u00e8le linguistique ouvert au monde pour l&#8217;arabe, une langue parl\u00e9e par environ 400 millions de personnes.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">L&#8217;utilisation du programme, appel\u00e9 Jais-Chat, se fait de la m\u00eame mani\u00e8re que la saisie dans l&#8217;invite de Chat-GPT, \u00e0 ceci pr\u00e8s que Jais-Chat peut prendre et produire des textes en arabe en entr\u00e9e et en sortie. Il peut, par exemple, \u00e9crire une lettre en arabe lorsqu&#8217;on lui demande de le faire en anglais :<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/www.zdnet.com\/a\/img\/resize\/f9dd8fac8199eed3adb8544d07c3e1dcb3179fb1\/2023\/08\/31\/f0f0ff98-a8f7-4bd9-89f1-b128c3a11e95\/jais-chat-example-of-writing-arabic-2023.jpg?width=1200&amp;fit=bounds&amp;auto=webp\" alt=\"jais-chat-example-of-writing-arabic-2023\"\/><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\"><em>Inception<\/em><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ou il peut prendre une invite en langue arabe et g\u00e9n\u00e9rer une r\u00e9ponse en arabe :<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/www.zdnet.com\/a\/img\/resize\/34310d9b9d1b70c01af2df9c077e183d06b17471\/2023\/08\/31\/3d0fe1be-0124-4a44-970c-1093384325d6\/jais-example-arabic-language-prompt-2023.jpg?width=1200&amp;fit=bounds&amp;auto=webp\" alt=\"jais-example-arabic-language-prompt-2023\"\/><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\"><em>Inception<\/em><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Entra\u00een\u00e9 sur un corpus sp\u00e9cial de textes arabes important, le programme renonce \u00e0 l&#8217;approche typique qui consiste \u00e0 construire un programme g\u00e9n\u00e9raliste qui traite des centaines de langues, dans de nombreux cas de mani\u00e8re m\u00e9diocre, et se concentre exclusivement sur les traductions anglaises et arabes.<br><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">&nbsp;publicit\u00e9&nbsp;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Jais-Chat a obtenu 10 points de plus que LlaMA 2<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Lors de tests &#8211; tels que&nbsp;<a href=\"https:\/\/arxiv.org\/pdf\/2009.03300.pdf\">le test QCM MMLU de l&#8217;Universit\u00e9 de Californie \u00e0 Berkeley<\/a>, et&nbsp;<a href=\"https:\/\/aclanthology.org\/P19-1472.pdf\">le test HellaSwag de l&#8217;Institut Allen pour l&#8217;IA<\/a>&nbsp;&#8211; Jais-Chat a obtenu 10 points de plus que les principaux LLM tels que LlaMA 2 de Meta. Il a battu les meilleurs programmes open-source tels que&nbsp;<a href=\"https:\/\/arxiv.org\/pdf\/2211.05100.pdf\">Bloom<\/a>&nbsp;de Big Science Workshop de cette ann\u00e9e, et il a \u00e9galement battu les mod\u00e8les de langage sp\u00e9cialis\u00e9s construits exclusivement pour l&#8217;arabe.<\/p>\n\n\n\n<figure class=\"wp-block-image is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/www.zdnet.com\/a\/img\/resize\/cc77cd427db86b674634d0d6288adb71b9e668de\/2023\/08\/31\/103f58a9-1df3-42d0-bd64-40cd394fa4ce\/jais-chat-versus-other-language-models-2023.jpg?width=1200&amp;fit=bounds&amp;auto=webp\" alt=\"jais-chat-versus-other-language-models-2023\" style=\"width:396px;height:353px\" width=\"396\" height=\"353\"\/><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">plus performant pour traiter les contextes tr\u00e8s longs, c&#8217;est-\u00e0-dire les entr\u00e9es d&#8217;un mod\u00e8le linguistique tap\u00e9es \u00e0 l&#8217;invite ou rappel\u00e9es de la m\u00e9moire.<br><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Le code de Jais est publi\u00e9 sous licence Apache 2.0 et est disponible sur Hugging Face<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">&#8220;Nous cherchions \u00e0 saisir les nuances linguistiques de l&#8217;arabe et les r\u00e9f\u00e9rences culturelles&#8221;, explique M. Feldman, qui a beaucoup voyag\u00e9 au Moyen-Orient. &#8220;Et ce n&#8217;est pas facile quand la majeure partie du mod\u00e8le est en anglais&#8221;.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Gr\u00e2ce \u00e0 ces modifications, le r\u00e9sultat est un mod\u00e8le linguistique appel\u00e9 Jais, et son application de chat, Jais-Chat, mesurant 13 milliards de &#8220;param\u00e8tres&#8221;, les poids neuronaux qui forment les \u00e9l\u00e9ments actifs critiques du r\u00e9seau neuronal. Jais est bas\u00e9 sur l&#8217;architecture GPT-3 con\u00e7ue par OpenAI, une version dite &#8220;d\u00e9codeur&#8221; du Transformer de Google datant de 2017.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le code du programme Jais est publi\u00e9 sous la licence de code source Apache 2.0 et est&nbsp;<a href=\"https:\/\/huggingface.co\/inception-mbzuai\/jais-13b-chathttps:\/\/huggingface.co\/inception-mbzuai\/jais-13b-chat\">disponible au t\u00e9l\u00e9chargement sur Hugging Face<\/a>. Une d\u00e9monstration de Jais peut \u00eatre utilis\u00e9e en&nbsp;<a href=\"https:\/\/auth.inceptioniai.org\/realms\/IIAI_CHAT\/protocol\/openid-connect\/auth?client_id=4kcbas7ohjr2c9qg3ze5dp1ni8tmvfwx&amp;redirect_uri=https:\/\/arabic-gpt.ai\/&amp;response_type=code&amp;scope=openid&amp;state=deb8cb2d155e40cb940df1d832736788&amp;code_challenge=wtKLRelHYfkMth_L6-6WFrAdPXzxVLL6L60xuTvX_kM&amp;code_challenge_method=S256&amp;response_mode=query\">s&#8217;inscrivant sur une liste d&#8217;attente<\/a>. Les auteurs pr\u00e9voient de rendre l&#8217;ensemble de donn\u00e9es public &#8220;dans un avenir proche&#8221;, selon M. Feldman.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Les programmes ont \u00e9t\u00e9 ex\u00e9cut\u00e9s sur ce que Cerebras appelle &#8220;le plus grand supercalculateur au monde pour l&#8217;IA&#8221;, appel\u00e9 Condor Galaxy 1, qui a \u00e9t\u00e9 construit pour G42 et a \u00e9t\u00e9 d\u00e9voil\u00e9 le mois dernier.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La machine est compos\u00e9e de 32 ordinateurs d&#8217;IA sp\u00e9cialis\u00e9s de Cerebras, les CS-2, dont les puces contiennent collectivement un total de 27 millions de c\u0153urs de calcul, 41 t\u00e9raoctets de m\u00e9moire et 194 trillions de bits par seconde de bande passante. Ils sont supervis\u00e9s par 36 352 processeurs de serveur EPYC x86 d&#8217;AMD. Les chercheurs ont utilis\u00e9 une partie de cette capacit\u00e9, soit 16 machines, pour former et &#8220;affiner&#8221; Jais.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Avec ses 13 milliards de param\u00e8tres, le programme est tr\u00e8s performant. Il s&#8217;agit d&#8217;un r\u00e9seau neuronal relativement petit, compar\u00e9 \u00e0 des \u00e9l\u00e9ments tels que le GPT-3, qui compte 175 milliards de param\u00e8tres.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">&#8220;Ses capacit\u00e9s pr\u00e9-entra\u00een\u00e9es surpassent tous les mod\u00e8les arabes open-source connus&#8221;, \u00e9crivent les chercheurs, &#8220;et sont comparables aux mod\u00e8les anglais open-source qui ont \u00e9t\u00e9 entra\u00een\u00e9s sur des ensembles de donn\u00e9es plus importants&#8221;.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Comme le notent les auteurs, l&#8217;ensemble de donn\u00e9es arabes de 72 milliards de tokens ne serait normalement pas suffisant pour un mod\u00e8le de plus de 4 milliards de param\u00e8tres, selon la r\u00e8gle empirique de l&#8217;IA connue sous le nom de &#8220;loi de Chinchilla&#8221;, formul\u00e9e par&nbsp;<a href=\"https:\/\/arxiv.org\/pdf\/2203.15556.pdf\">les chercheurs de DeepMind de Google<\/a>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En fait, non seulement Jais-Chat dans sa forme \u00e0 13 milliards de param\u00e8tres surpasse LlAMA 2, mais dans une version plus petite de leur programme avec seulement 6,7 milliards de param\u00e8tres, ils sont \u00e9galement en mesure d&#8217;obtenir de meilleurs r\u00e9sultats aux m\u00eames tests tels que MMLU et HellaSwag.<\/p>\n\n\n\n<figure class=\"wp-block-image is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/www.zdnet.com\/a\/img\/resize\/eb3bddbd138a53dbc9f3640622c833d6824da47f\/2023\/08\/31\/c799b636-4a2f-4a91-94f2-3580af47afa2\/jais-slide-deck-08-30-23pptx-slide-14.jpg?width=1200&amp;fit=bounds&amp;auto=webp\" alt=\"jais-slide-deck-08-30-23pptx-slide-14\" style=\"width:302px;height:234px\" width=\"302\" height=\"234\"\/><\/figure>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/www.zdnet.fr\/actualites\/cerebras-et-abu-dhabi-construisent-le-modele-d-ia-en-langue-arabe-le-plus-puissant-au-monde-39961156.htm\">https:\/\/www.zdnet.fr\/actualites\/cerebras-et-abu-dhabi-construisent-le-modele-d-ia-en-langue-arabe-le-plus-puissant-au-monde-39961156.htm<\/a><\/p>\n<\/blockquote>\n","protected":false},"excerpt":{"rendered":"<p>Cerebras et Abu Dhabi construisent le mod\u00e8le d&#8217;IA en langue arabe le plus puissant au monde https:\/\/auth.inceptioniai.org\/realms\/IIAI_CHAT\/protocol\/openid-connect\/auth?client_id=4kcbas7ohjr2c9qg3ze5dp1ni8tmvfwx&#038;redirect_uri=https:\/\/arabic-gpt.ai\/&#038;response_type=code&#038;scope=openid&#038;state=deb8cb2d155e40cb940df1d832736788&#038;code_challenge=wtKLRelHYfkMth_L6-6WFrAdPXzxVLL6L60xuTvX_kM&#038;code_challenge_method=S256&#038;response_mode=query Jais-Chat, nomm\u00e9 d&#8217;apr\u00e8s la plus haute montagne des \u00c9mirats arabes unis, peut prendre un message en arabe ou en anglais et compl\u00e9ter la phrase, tout comme le fait Chat-GPT. Tiernan Ray + DreamStudio de Stability.ai Signe des temps [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":797,"comment_status":"closed","ping_status":"closed","sticky":true,"template":"","format":"standard","meta":{"_themeisle_gutenberg_block_has_review":false,"footnotes":""},"categories":[40,38,35,60,67,31,29,30,66],"tags":[57,34,32],"series":[],"class_list":["post-796","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-alpaca","category-dalai-ia","category-deep-fake","category-eye","category-falcon-180b","category-gpt","category-ia","category-intelligence-artificielle","category-jais","tag-falcon","tag-gpt","tag-ia"],"_links":{"self":[{"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=\/wp\/v2\/posts\/796","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=796"}],"version-history":[{"count":8,"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=\/wp\/v2\/posts\/796\/revisions"}],"predecessor-version":[{"id":807,"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=\/wp\/v2\/posts\/796\/revisions\/807"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=\/wp\/v2\/media\/797"}],"wp:attachment":[{"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=796"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=796"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=796"},{"taxonomy":"series","embeddable":true,"href":"https:\/\/sciencesetrecherches.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fseries&post=796"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}