كيف سيساعد الذكاء الاصطناعي التوليدي سيري في التفوق على ChatGPT؟
لقد التزمت شركة آبل الصمت خلال مدة الصعود الصاروخي لروبوت ChatGPT – الذي غير القطاع التقني بنحو كبير خلال مدة قصيرة من إطلاقه – وكذلك خلال الانتشار الواسع لأدوات ومزايا الذكاء الاصطناعي التوليدي التي قدمتها كبرى الشركات المنافسة لها، وأبرزها: جوجل ومايكروسوفت، وسامسونج، لكن من المتوقع أن يتغير كل ذلك قريبًا، إذ طور باحثو آبل نموذجًا لغويًا جديدًا يُسمى (ReALM) من شأنه أن يمنح المساعد الصوتي (سيري) Siri، الترقية التي يأملها مستخدمو أجهزة آبل.
وتعليقًا على ذلك؛ قال الباحثون: “يعالج نموذج (ReALM) الجديد مشكلة النماذج اللغوية الكبيرة (LLMs) التي تكمن في عدم القدرة على فهم السياق عندما يتعلق الأمر بالإشارات السياقية والغامضة التي تظهر في أثناء المحادثات وفي الخلفية، وقد أظهر النموذج تحسنًا ملحوظًا مقارنةً بالنماذج ذات الوظائف المماثلة، حيث يتفوق أصغر إصداراته بنسبة تصل إلى 5% في معالجة محتوى الشاشة”. كما أشاروا إلى أن الإصدار الأكبر حجمًا من نموذج (ReALM) يقدم أداءً أفضل بكثير من (GPT-4)، النموذج الأكثر تطورًا الذي تقدمه شركة OpenAI.
لذلك في هذا المقال؛ سنسلط الضوء على نموذج (ReALM) الجديد الذي تطوره آبل، وسنوضح كيف يمكن أن يساعد المساعد سيري في التفوق على ChatGPT؟
أولًا؛ ما نموذج (ReALM)؟
يهدف نموذج الذكاء الاصطناعي (ReALM) الذي تطوره آبل إلى تعزيز قدرات مساعدها الصوتي (سيري) في فهم السياق وتحسين الأداء في معالجة المحتوى المرئي الذي يظهر في الشاشة.
ويأتي هذا النموذج الجديد في أربعة إصدارات تختلف من حيث الحجم، وهي: ReALM-80M و ReALM-250M و ReALM-1B و ReALM-3B، وقد طُورت كلها لتكون فعالة حسابيًا للتكامل في الأجهزة المحمولة، وتتيح هذه الكفاءة أداءً متسقًا مع تقليل استخدام الطاقة وتقليل الضغط على موارد المعالجة، وهو أمر مهم لإطالة عمر البطارية وتوفير أوقات استجابة سريعة في مجموعة متنوعة من الأجهزة.
وقد أظهرت اختبارات الأداء التي نشرها الباحثون أن أصغر إصدارات نموذج (ReALM) يقدم أداءً مماثلًا لنموذج (GPT-4)، بل يتفوق عليه في معالجة محتوى الشاشة، وأن الإصدار الأكبر حجمًا من النموذج يقدم أداءً أفضل بكثير من نموذج (GPT-4).
ثانيًا؛ كيف سيساعد نموذج (ReALM) سيري في التفوق على ChatGPT؟
1- فهم سياق الشاشة:
طور باحثو آبل نموذج (ReALM) باستخدام البيانات التي تظهر في الشاشة من صفحات الويب، بما يشمل: معلومات الاتصال، مما يتيح للنموذج فهم النص الموجود داخل لقطات الشاشة – على سبيل المثال: العناوين وتفاصيل الحساب المصرفي – في حين أن نموذج (GPT-4) قادر أيضًا على فهم الصور، ولكنه لم يُدرب على صور لقطات الشاشة.
وقد أوضح الباحثون في الورقة البحثية التي نشروها أن هذه البيانات هي ما تجعل نموذج (ReALM) أفضل في فهم المعلومات التي تظهر في الشاشة، والتي يطلب مستخدمو آبل المساعدة من سيري بشأنها.
2- سياق المحادثة والخلفية:
يشير الاستدلال الحواري إلى شيء ذي صلة بالمحادثة، ولكن ربما لم يُذكر صراحة في السؤال، ومن خلال تدريب نموذج (ReALM) على بيانات مثل: قوائم الأعمال التجارية، يمكنه فهم المطالبات مثل: “اتصل بالصيدليات الموجودة في الجوار” في إشارة إلى قائمة الصيدليات القريبة المعروضة في الشاشة، دون الحاجة إلى تقديم مطالبات أكثر تحديدًا.
بالإضافة إلى ذلك؛ نموذج (ReALM) لديه القدرة على فهم (كيانات البيانات الخلفية)، وهو ما يعني شيئًا يعمل في خلفية الجهاز وقد لا يكون بالضرورة جزءًا مباشرًا مما يراه المستخدم في شاشته أو في أثناء تفاعله مع المساعد الصوتي، مثل: تشغيل الموسيقى أو تشغيل المنبه، أو تنزيل الملفات.
3- عمل مزايا الذكاء الاصطناعي التوليدي في الجهاز نفسه:
تولي آبل الأولوية لإدماج مزايا الذكاء الاصطناعي التوليدي في الجهاز نفسه لضمان خصوصية وأمان المستخدم، إذ تهدف إلى توفير إمكانيات الذكاء الاصطناعي القوية دون المساس بحماية بيانات مستخدميها.
لذلك صممت آبل نموذج (ReALM) ليعمل بالكامل في الجهاز، وهو ما سيكون أمرًا مهمًا للغاية نظرًا إلى أن النماذج اللغوية الكبيرة تتطلب قدرة حوسبة هائلة، ومن ثم فهي تعتمد في الغالب على الحوسبة السحابية. على عكس ذلك، يُعدّ ReALM نموذجًا لغويًا صغير الحجم، ولكنه ضُبط بنحو محدد وصريح لمهمة التحليل المرجعي.
ولطالما ارتبطت شركة آبل بالخصوصية، وأعدتها مزية أساسية في أجهزتها، ولذلك، فإن تقديم نسخة جديدة من المساعد الصوتي (سيري) تستند في عملها إلى الذكاء الاصطناعي التوليدي والنماذج اللغوية الكبيرة (LLMs)، وتعمل بالكامل في الجهاز سيكون أمرًا متوافقًا تمامًا مع هوية العلامة التجارية لآبل، وسيُعدّ إنجازًا كبيرًا للأجهزة التي تتمتع بقدرات الذكاء الاصطناعي التوليدي.
ومع ذلك؛ تحافظ آبل على غموض متوقع بشأن خططها المتعلقة بالذكاء الاصطناعي التوليدي حتى الآن، ولكن كل التقارير والتسريبات التي ظهرت تشير إلى أن الإصدار القادم من نظام التشغيل iOS، سيكون التحديث الأكبر في تاريخ شركة آبل بفضل الذكاء الاصطناعي، لذلك تتجه كل الأنظار إلى مؤتمر آبل السنوي للمطورين (WWDC 2024)، المقرر عقده في العاشر من يونيو المقبل.