إنها اللحظة التي ينتظرها الجميع طوال العام: سبوتيفي ملفوفة وقت. على الرغم من أنه تم إطلاقه في وقت متأخر عما كان متوقعًا في البداية، إلا أن الخاتمة السنوية المخصصة متاحة للمشتركين لمعرفة أين وصلت أذواقهم الموسيقية لهذا العام. ما هو متاح أيضًا هو بودكاست مخصص من باب المجاملة Google NotebookLM، ويضم اثنين من مضيفي الذكاء الاصطناعي الذين يكافحون من أجل نطق أي أغنية أو فنان ليس من النوع الأنجلوسكسوني.
الذكاء الاصطناعي ليس مثاليا. حتى مع العروض التوضيحية الأكثر إقناعًا في مؤتمرات المطورين، فإن تحويل النص إلى كلام بواسطة الذكاء الاصطناعي يبدو دائمًا مجبرًا بعض الشيء مقارنة بالطريقة التي يتحدث بها البشر. أفضل مثال هو بودكاست Spotify’s Wrapped AI، والذي يشبه عرض Google في وقت سابق من هذا العام في جوجل آي/أو. من المؤكد أن المضيفين مقنعون، ولكن كلما استمعت لفترة أطول إلى البودكاست المُعد صناعيًا، أصبح من الواضح أنك تستمع إلى زوج من الروبوتات يلخص إحصائيات الاستماع الخاصة بك.
يبدأ البودكاست الذي يتم إنتاجه بواسطة الذكاء الاصطناعي بشكل قياسي. يبدو الأمر وكأنني وشريكي في البث الصوتي في إحدى حلقات برنامج عرضنا. أولاً، يسلط المضيفون الضوء على أطول يوم استمعت فيه إلى Spotify خلال العام. لقد التقطت الأمر في يوم عاطفي بشكل خاص عندما كنت أستمع إلى ساعات من الموسيقى الحزينة. تساءل مضيفو الذكاء الاصطناعي بصوت عالٍ عما إذا كان ذلك بسبب أنني كنت في رحلة برية في ذلك اليوم. (لم أكن كذلك. كنت أبكي!) هذه فرصة حيث كان من الممكن للذكاء الاصطناعي أن يتراجع عن وضع الافتراضات. مثل صديق لا يفكر في تأثير كلماته، دفعني الذكاء الاصطناعي إلى العودة إلى يوم من الانزعاج الكبير. سلوك فظ!
بعد ذلك، يقرأ مضيفو الذكاء الاصطناعي الفنانين والأغاني الأكثر تشغيلًا لهذا العام. ما زلت أفضّل الاستماع إلى محاولة بشرية فعلية حية لنطق اسم الفنان الهولندي المفضل لدي، جوست كلاين، بدلاً من NotebookLM من Google. يُنطق اسمه “Yost”، لكن البودكاست يشير إليه بدلاً من ذلك على أنه “معصور”. والأمر أسوأ عندما يحاولون نطق الأغاني الهولندية. أغنيتي الأكثر تشغيلًا هذا العام تسمى “Wachtmuziek”، ويقوم مضيفو NotebookLM من Google بنطقها تمامًا كما قد تحاول قراءتها كمتحدث غير هولندي، دون الحاجة إلى استخدام كلمة “Wachtmuziek”. الصقور الحظ وهذا ما تم نطقه بـ “cht”.
سيجد المتحدثون باللغة الإسبانية أيضًا أن NotebookLM من Google يواجه صعوبة في التعامل مع اللغة اللاتينية. شارك المحرر الخاص بي البودكاست الشخصي الخاص بي معي، وأنا أشعر بالحرج كلما حاولوا التعرف على أغنية لـ Bad Bunny. لا تجعلني أبدأ بالنطق المقتضب لـ “ray-gay-ton”، وهو لا كيف يقال لاب بصوت عال. أود أن أزعم أن نطق الكلمة بالتنغيم المناسب يكون النوع. عامل الإذعان مرتفع مع هذا.
وهذا يقودني إلى التساؤل: أليس هذا شيئًا يجب على الذكاء الاصطناعي أن يلتقطه؟ يتم تصنيف الموسيقى تحت اللغة التي يتم تقديمها بها. أتصور أنه من الممكن برمجة الروبوت للاستفادة من تلك البيانات وتعديلها وفقًا لذلك. يُحسب لمطوريها أن جوجل غطت قواعدها من خلال الإشارة إلى أن مضيفي الذكاء الاصطناعي الخاصين بها يخطئون أحيانًا في نطق الكلمات. لكن الأمر يخرج السحر من الذكاء الاصطناعي عندما تدرك أن الروبوت معيب تمامًا في فشله في ممارسة النطق مثلنا تمامًا.
يتوفر بودكاست Spotify’s Wrapped AI مع براعة Google للمستخدمين المجانيين والمتميزين في الولايات المتحدة والمملكة المتحدة وأستراليا ونيوزيلندا وكندا وأيرلندا والسويد لفترة محدودة.