أخبار أندرويدالتعليقات على للاقتراب أكثر من حديث البشر: جوجل تطلق تقنية WaveNet ضمن مساعدها الذكيّ Google Assistant مغلقة
على الرّغم من التطور الكبير الذي حصل بمجال المساعدات الرقمية الذكية، فإن مشكلةً واحدة لا تزال حاضرة منذ إطلاقها وحتى الآن: أنها “رقمية”! وهنا أعني أن طريقة إجابتها على أسئلة واستعلامات المستخدمين توحي بشكلٍ فوريّ أنها أمرٌ “اصطناعيّ”. عندما قامت جوجل بإطلاق مساعدها الذكيّ Google Assistant، تم العمل على تطويره بحيث يتمكن من فهم سياق الحديث، وعلى الرّغم من تفوقه بهذا المجال، إلا أن الصوت البشريّ الذي يجيب على استعلامات المستخدمين لا يزال يمتلك طابعًا “روبوتيًا”.
لهذا السبب، ومن أجل توفير تجربة استخدام أقرب للمحادثة البشرية الطبيعية، تم تضمين تقنية WaveNet ضمن المساعد الذكيّ Google Assistant والتي من شأنها المساعدة على توليد صوت وحديثٍ يمتلك مواصفاتٍ وخصائص قريبة جدًا من الحديث البشريّ الطبيعيّ، وذلك بدلًا من آليات تحويل النص إلى حديث TTS: Text-to-Speach التقليدية ذات الأداء المنخفض بهذا الخصوص.
لتوضيح أهمية تقنية WaveNet يجب التطرّق قليلًا لمفهوم تحويل النص إلى حديث أو اصطناع الحديث Speech Synthesis، وهي عبارة عن برمجيات وظيفتها توليد حديث اعتمادًا على نصوصٍ مدخلة إليه. أشهر الطرق التقليدية هي Concatenative TTS والتي تعتمد على عددٍ كبيرٍ من التسجيلات الصوتية المأخوذة من نفس الشخص، حيث يتم توليد الألفاظ الجديدة من هذه التسجيلات، ودائمًا ما يعاب على هذه التقنية بالأداء غير الطبيعيّ أو أنه غير واضح أو مفهوم. يتم أيضًا استخدام طريقة أخرى هي Parametric TTS التي تأخذ بعين الاعتبار القواعد اللغوية وحركات الفم من أجل توليد الألفاظ والحديث.
بالنسبة لتقنية WaveNet، فهي توّفر طريقًا مختلفًا وبشكلٍ كليّ لتوليد الألفاظ، حيث وبدلًا من الاعتماد على قاعدة بيانات ضخمة يتم اقتطاع الأصوات وتركيبها منها، يتم العمل على بناء الجمل والألفاظ من الصفر ولكن عبر نموذجٍ ذكيّ مبنيّ على الشبكات العصبونية قادر على توليد عيناتٍ صوتية بشكلٍ كبير يصل عددها حتى 16000 عينة بالثانية، وذلك بعد أن تم تدريب النموذج ليكون قادرًا على فهم بنية وتركيب الصوت والحديث البشريّ مع الأخذ بعين الاعتبار بعض الخواص المتقدمة كنبرة الصوت أو حركة الشفاه. التسجيلات الصوتية التالية تظهر الصوت الذي تم توليده للمساعد الذكيّ قبل استخدام تقنية WaveNet وبعدها:
تقول جوجل أن النموذج الأوليّ من تقنية WaveNet وفر أداءًا ممتازًا ولكن كان من الصعب تضمينه ببرنامج ذو انتشارٍ تجاريّ واسع مثل Google Assistant، ولذلك تم العمل على تحسينه من حيث سرعته وقدرته على توليد الكلمات والألفاظ الصوتية، ليصبح اليوم أسرع بـ 1000 مرة من النموذج الأصليّ الذي تم إطلاقه قبل عام، حيث سيحتاج الآن إلى زمنٍ قدره 50 ميللي ثانية لتوليد حديثٍ مدته ثانية واحدة. من ناحيةٍ أخرى، تقول جوجل أن التقنية توّفر حاليًا صوتًا ذو أداءٍ قريبٍ جدًا من الصوت الطبيعيّ، مع تسجيل نتيجةٍ قدرها 4.347 على مقياسٍ من 1 إلى 5.
من المفترض أن جوجل قد بدأت بطرح تحديثٍ لكل المستخدمين الذين يمتلكون المساعد الذكيّ Google Assistant والذي من شأنه تضمين تقنية WaveNet داخلها، وما يعني الحصول على صوتٍ واستجابة طبيعية أكثر.
غير مصنفالتعليقات على عصر الآلات: برنامج AlphaGo الذكي من جوجل يهزم ذكاء الإنسان ثلاث مراتٍ مُتتالية مغلقة
في عام 1997، تمكّن الحاسوب الذكي Deep Blue من هزيمة بطل العالم في الشطرنج غاري كاسباروف، وهو الحدث الذي اعتبر علامةً بارزة بمسيرة تطور الذكاء الصنعي وقدرة الآلة على التفكير المنطقيّ واتخاذ القرارات المُعقدة التي تتطلب التخطيط للعبةٍ استراتيجية ذات عدد ضخم من الاحتمالات مثل الشطرنج. اليوم تُعيد جوجل كتابة التاريخ مرة أخرى، وذلك عبر برنامجها الذكي AlphaGo الذي تمكّن من التفوق على الذكاء البشريّ في لعبة GO، عبر تحقيق ثلاث انتصاراتٍ مُتتالية على بطل العالم الكوري Lee Sedol، قبل أن يتمكن الكوري الجنوبي من رد الاعتبار اليوم وتحقيق أول فوزٍ له على البرنامج الذكيّ.
مشروع AlphaGo هو أحد المشاريع الخاصة ببرنامج جوجل للذكاء الصنعيّ المعروف باسم DeepMind. تعمل جوجل عبر برنامج DeepMind على تطوير برامج وخوارزمياتٍ حاسوبية ذات قُدراتٍ عالية من حيث مُعالجة المعلومات واتخاذ القرار، بحيث تكتسب هذه البرامج قُدراتها الذكية عبر التعلم بالخبرة، بشكلٍ مُشابهٍ تمامًا لتعلّم الإنسان، حيث يقوم الإنسان بتطوير المَعلومات التي يُخزّنها ويصقلها مع الخبرة والتقدم بالعمر.
لو أردنا تمثيل مبدأ تعلم الآلات بالخبرة، فيُمكن الاستعانة دومًا بمثال الطفل الصغير: الطفل لا يدرك أن النار شيءٌ مُؤلم، ولكنه سيتعلم ذلك بعد أن يُحاول لمس النار. عند محاولته للمس النار، سيشعر بحرارتها وسيتولد لديه شعور الألم، وسيبدأ طبعًا بالبكاء. هذه التجربة ستُخزّن ضمن الدماغ، وسيكتسب دماغ الطفل معلومة تقول أن النار مؤذية ولا يجب لمسها. نفس الأمر ينطبق على تعلم اللغات، الكلام، المهارات الرياضية، الموسيقى، الرسم وغيرها من المهارات المتعددة التي يمكن للإنسان أن يتعلمها.
بالنسبة للذكاء الصنعيّ، فإن العلماء كانوا ولا يزالوا يحاولون تطوير الآليات والطرق التي تقوم بها الآلات باتخاذ القرار. إعطاء الآلة القدرة على اتخاذ القرار اعتمادًا على التّعليمات المُخزنة مُسبقًا بها لا يُعتبر ذكاءً بالمعنى الدقيق للكلمة، وذلك لأن المُبرمج هو من يُحدد كيفية تصرف الآلة اعتمادًا على التعليمات والبرنامج الذي قام بكتابته، وخارج إطار الشيفرة التي كتبها المبرمج، لن تكون الآلة قادرة على تنفيذ أي شيء. بدلًا من ذلك، تهدف خوارزميات الذكاء الصُنعيّ وتعلم الآلة Machine Learning إلى إجراء التّجارب، وتسجيل خلاصة هذه التجربة والاستفادة منها في التجارب اللاحقة. بمعنى آخر، الشيفرة التي ستمتلكها الآلة بهذه الحالة هي عبارة عن خوارزمية تفكير، تقوم بتسجيل نتائج التجارب التي تقوم بها، ومن ثم تعدل من طريقة التفكير نفسها تبعًا للنتائج التي تحصل عليها، فكلما زادت المعلومات التي تحصل عليها (الخبرة) كلما ازدادت قدرة الآلة على اتخاذ القرار بشكلٍ أفضل.
اعتمدت جوجل على هذا المبدأ في تصميم وبناء برنامج AlphaGo، حيث اعتمدت على خوارزميات الشبكات العصبونية Neural Networks لبناء البرنامج، ثم تركته يقوم بمُمارسة اللعبة لفترةٍ طويلة نسبيًا ليكتسب الخبرة اللازمة ويطور استراتيجيته الخاصة للفوز بها. الخُطوة التالية كانت وضع البرنامج أمام اختبارٍ حقيقيّ عبر تحدي لاعبٍ بشريّ، وهو ما تم العام الماضي عبر تحدي بطل أوروبا في لعبة GO، وفاز برنامج جوجل بنتيجة 5-0.
التحدي الأبرز كان مع بطل العالم في اللعبة، الكوري الجنوبي Lee Sedol، والذي يُعتبر أحد أبرز خبراء اللعبة حول العالم. بدأ التحدي قبل قرابة أسبوع، وتمكن برنامج AlphaGo من تحقيق ثلاث انتصاراتٍ متتالية، قبل أن يتمكن بطل العالم من تحقيق الفوز اليوم على برنامج AlphaGo، حيث يبدو أن البطل الكوري قد تمكن من معرفة استراتيجية البرنامج لتحقيق الفوز في اللعبة. لا يزال هنالك لعبة أخيرة، حيث يبلغ مجموع مباريات التحدي خمسة مباريات.
(لمن يود مشاهدة التّحدي الأخير والتحديات السابقة، يمكنكم زيارة صفحة DeepMind على اليوتيوب: اضغط هنا).
لماذا يُعتبر فوز برنامج AlphaGo حدثًا هامًا ؟
ربما هو السؤال الذي يسأله معظمكم منذ بداية المقال أو منذ قراءة العنوان. السبب ببساطة هو تعقيد اللعبة نفسها، والتي يفوق عدد الاحتمالات الممكنة فيها عدد الذرات في كامل الكون! برنامج AlphaGo هو أول برنامج حاسوبي قام باحتراف اللعبة، حيث لم تقم أي شركة من قبل بدعم مثل هكذا مشروع.
تتألف اللعبة من رقعةٍ مُربعة أبعادها 19×19 عليها خطوط مُتقاطعة بالطول العرض. يمتلك كل لاعب عددًا من القطع إما بيضاء وإما سوداء. يسمح للاعب بوضع القطعة الخاصة به على أحد التقاطعات على الرقعة، والهدف هو أن يقوم اللاعب بمحاصرة القطع الخاصة بالخصم من كل الجهات، فإذا تمكن من ذلك، يستطيع أن يزيل القطعة التي حاصرها.
الاستراتيجية المطلوبة للفوز بلعبة GO تعتمد على القرارات البديهية السريعة، بخلاف لعبة الشطرنج التي تعتمد على قراراتٍ وخطواتٍ استراتيجية محددة بحسب نوع كل حجر من حجارة اللعبة. هذا يعني أنه يمكن تدريب الحاسوب على الفوز بلعبة الشطرنج بشكلٍ أسهل من GO. من ناحيةٍ أخرى، وبما أن لعبة GO تعتمد على قرارٍ يعتمد على سرعة البديهة أكثر من التخطيط الاستراتيجيّ، فإن آلية التفكير المطلوبة للفوز بها تتطلب قدراتٍ شبيهة جدًا بآلية تفكير الإنسان، ما يجعل الفوز باللعبة إثباتًا على قدرة الآلات على التفكير بشكلٍ مشابهٍ جدًا للإنسان.
ماذا بعد: ما هي فائدة وجود آلة بهذا الذكاء؟
ربما هذا هو السؤال الأهم، فإذا كان فوز برنامج AlphaGO هو مجرد خبر عابر وممتع، فإنه سيكون بدون أي قيمة. يجب أن نحدد ما هي أهمية وصول الآلات لهذه القدرات المعقدة من التفكير واتخاذ القرار.
بدايةً، علينا أن ندرك أن تطبيقات الذكاء الصنعيّ وتعلم الآلة موجودةٌ حولنا بشكلٍ أكبر مما نتخيل. خدمة البحث الصوتيّ من جوجل Voice Search والتي أصبحنا نتملكها في خدماتٍ مثل متصفح كروم وخدمة Google Now هي أحد مظاهر الذكاء الصنعي الذي يستطيع التعرف على الكلام الذي نقوله والبحث عما نريد بكل كفاءة وفعالية.
مايكروسوفت أطلقت منذ فترة تطبيق Mimicker Alarm الذي يعتمد على التفاعل بين الإنسان والآلة وعلى الذكاء الصنعيّ لمعرفة فيما إذا كان المستخدم قد استيقظ بالفعل أم لا. تطبيقات الحماية والأمان التي تعتمد على التعرف على الوجوه أو الصوت هي أحد مظاهر ذكاء الآلة.
لو انتقلنا للمجالات الأكثر تعقيد، فإن الخوارزميات الذكية تقدم فوائد عظيمة بمجال البحث العلميّ، فمع تزايد كمية البيانات والمعلومات التي يتم توليدها بشكلٍ كبير كل يوم، تزداد حاجة العلماء لقدراتٍ حاسوبية أقوى، أعقد، وأكثر كفاءة للبحث ضمن كميات المعلومات الضخمة واختيار المعلومة الأفضل، خصوصًا بمجالاتٍ تتطلب مراقبة دقيقة ومستمرة مثل علوم الأرصاد الجيولوجية والجوية بغرض دراسة المناخ والتنبؤ بالحوادث والكوارث الطبيعية، أو مجال الدراسات الفيزيائية وتجارب فيزياء الطاقة والفيزياء الفلكية.
جوجل تعمل بشكلٍ جاد جدًا ضمن عدد من المشاريع الذكية التي ترسم ملامح تقنية المستقبل، والذكاء الصنعيّ هو أحد أهم هذه المجالات عبر مشروع Google DeepMind. هل سنشاهد التطبيقات الملموسة لهذه المشاريع خلال وقتٍ قريب؟ أم أنه لا يزال من المبكر الحديث عن الآلات الواعية؟ شاركونا رأيكم ضمن التعليقات.
أحدث التعليقات