تطلق OpenAI واجهة برمجة تطبيقات لـ ChatGPT ، بالإضافة إلى سعة مخصصة لعملاء المؤسسات

للاتصال بـ ChatGPT ، الذكاء الاصطناعي المجاني لإنشاء النصوص والذي طورته شركة OpenAI ومقرها سان فرانسيسكو ، فإن النجاح هو بخس كبير.

اعتبارًا من ديسمبر ، كان لدى ChatGPT ما يقدر بأكثر من 100 مليون مستخدم نشط شهريًا. لقد اجتذب اهتمام وسائل الإعلام الرئيسية وأنتج عددًا لا يحصى من الميمات على وسائل التواصل الاجتماعي. تم استخدامه لكتابة مئات الكتب الإلكترونية في متجر كيندل أمازون. ويُنسب إليها المشاركة في تأليف ورقة علمية واحدة على الأقل.

لكن OpenAI ، كونها شركة – وإن كانت ذات ربح محدود – كان عليها أن تسييل ChatGPT بطريقة ما ، حتى لا يشعر المستثمرون بالنفور. استغرق الأمر خطوة نحو ذلك بإطلاق خدمة مميزة ، ChatGPT Plus ، في فبراير. وقد اتخذت خطوة أكبر اليوم ، حيث قدمت واجهة برمجة تطبيقات ستسمح لأي شركة ببناء تقنية ChatGPT في تطبيقاتها ومواقعها الإلكترونية ومنتجاتها وخدماتها.

API كان دائما الخطة. هذا وفقًا لجريج بروكمان ، رئيس ورئيس مجلس إدارة أوبن إيه آي (وأيضًا أحد المؤسسين). تحدث معي بعد ظهر أمس عبر مكالمة فيديو قبل إطلاق ChatGPT API.

قال بروكمان: “يستغرق الأمر بعض الوقت حتى تصل واجهات برمجة التطبيقات هذه إلى مستوى معين من الجودة”. “أعتقد أنه نوع من هذا ، مثل ، مجرد القدرة على تلبية الطلب والنطاق.”

يقول Brockman إن ChatGPT API مدعوم من نفس نموذج الذكاء الاصطناعي وراء ChatGPT من OpenAI ، والذي يطلق عليه اسم “gpt-3.5-turbo”. GPT-3.5 هو أقوى نموذج لتوليد النصوص تقدمه OpenAI اليوم من خلال مجموعة API الخاصة بها ؛ يشير لقب “turbo” إلى إصدار محسن وأكثر استجابة من GPT-3.5 والذي اختبرته OpenAI بهدوء لـ ChatGPT.

بسعر 0.002 دولار لكل 1000 رمز ، أو حوالي 750 كلمة ، يدعي بروكمان أن واجهة برمجة التطبيقات يمكن أن تقود مجموعة من التجارب ، بما في ذلك تطبيقات “غير الدردشة”. Snap و Quizlet و Instacart و Shopify من بين أوائل المستخدمين.

ربما كان الدافع الأولي وراء تطوير gpt-3.5-turbo هو خفض تكاليف الحوسبة الضخمة لـ ChatGPT. وصف سام ألتمان ، الرئيس التنفيذي لشركة OpenAI ، ذات مرة نفقات ChatGPT بأنها “مروعة للعين” ، وقدّرها ببضعة سنتات لكل دردشة بتكاليف الحوسبة. (مع وجود أكثر من مليون مستخدم ، من المفترض أن يضيف ذلك بسرعة.)

لكن بروكمان يقول إن gpt-3.5-turbo تم تحسينه بطرق أخرى.

“إذا كنت تقوم ببناء مدرس مدعوم بالذكاء الاصطناعي ، فأنت لا تريد أبدًا أن يعطي المعلم إجابة للطالب. أنت تريد أن تشرحها دائمًا وتساعدهم على التعلم – وهذا مثال على نوع النظام الذي يجب أن تكون قادرًا على بنائه [باستخدام واجهة برمجة التطبيقات] ، “قال بروكمان. “نعتقد أن هذا سيكون شيئًا من شأنه أن يجعل واجهة برمجة التطبيقات أكثر قابلية للاستخدام والوصول إليها.”

تدعم واجهة برمجة تطبيقات ChatGPT My AI ، وروبوت الدردشة المُعلن عنه مؤخرًا لمشتركي Snapchat + من Snap ، وميزة Q-Chat الافتراضية الجديدة من Quizlet. استخدم Shopify واجهة برمجة تطبيقات ChatGPT لإنشاء مساعد شخصي لتوصيات التسوق ، بينما استفاد Instacart منه لإنشاء Ask Instacart ، وهو رسم قادم سيسمح لعملاء Instacart بالسؤال عن الطعام والحصول على إجابات “قابلة للتسوق” مستنيرة ببيانات المنتج من البيع بالتجزئة للشركة شركاء.

قال لي كبير المهندسين المعماريين في Instacart JJ Zhuang عبر البريد الإلكتروني: “قد يتطلب شراء البقالة عبئًا ذهنيًا كبيرًا ، مع وجود الكثير من العوامل في اللعب ، مثل الميزانية ، والصحة والتغذية ، والأذواق الشخصية ، والموسمية ، ومهارات الطهي ، ووقت الإعداد ، وإلهام الوصفات” . “ماذا لو تمكن الذكاء الاصطناعي من تحمل هذا العبء العقلي ، ويمكننا مساعدة قادة الأسرة المسؤولين عمومًا عن شراء البقالة ، وتخطيط الوجبات ، ووضع الطعام على الطاولة – وجعل التسوق من البقالة أمرًا ممتعًا حقًا؟ سيمكننا نظام الذكاء الاصطناعي من Instacart ، عند دمجه مع ChatGPT من OpenAI ، من القيام بذلك بالضبط ، ويسعدنا أن نبدأ في تجربة ما هو ممكن في تطبيق Instacart “.

ومع ذلك ، قد يتساءل أولئك الذين تابعوا قصة ChatGPT عن كثب عما إذا كانت جاهزة للإفراج عنها – وهذا صحيح.

في وقت مبكر ، كان المستخدمون قادرين على حث ChatGPT للإجابة على الأسئلة بطرق عنصرية وجنسية ، وهو انعكاس للبيانات المتحيزة التي تم تدريب ChatGPT عليها في البداية. (تتضمن بيانات تدريب ChatGPT مجموعة كبيرة من محتوى الإنترنت ، مثل الكتب الإلكترونية ومنشورات Reddit ومقالات Wikipedia.) كما تخترع ChatGPT الحقائق دون الكشف عن أنها تقوم بذلك ، وهي ظاهرة في الذكاء الاصطناعي تُعرف بالهلوسة.

ChatGPT – والأنظمة المماثلة – عرضة للهجمات السريعة أيضًا ، أو مطالبات الخصومة الخبيثة التي تجعلهم يؤدون مهام لم تكن جزءًا من أهدافهم الأصلية. تشكلت مجتمعات كاملة على Reddit حول إيجاد طرق لـ “كسر الحماية” ChatGPT وتجاوز أي إجراءات وقائية وضعتها OpenAI. في أحد الأمثلة الأقل هجومًا ، كان الموظف في Startup Scale AI قادرًا على جعل ChatGPT يكشف عن معلومات حول أعماله الفنية الداخلية.

لا شك أن العلامات التجارية لن ترغب في الوقوع في مرمى النيران. بروكمان يصر على أنهم لن يكونوا كذلك. لما ذلك؟ أحد الأسباب ، كما يقول ، هو التحسينات المستمرة في النهاية الخلفية – في بعض الحالات على حساب العمال الكينيين المتعاقدين. لكن بروكمان شدد على نهج جديد (وأقل إثارة للجدل بالتأكيد) الذي تطلقه شركة OpenAI على لغة ترميز الدردشة أو ChatML. يقوم ChatML بتغذية النص إلى ChatGPT API كسلسلة من الرسائل مع البيانات الوصفية. هذا على عكس ChatGPT القياسي ، الذي يستهلك نصًا خامًا يتم تمثيله كسلسلة من الرموز المميزة. (سيتم تقسيم كلمة “رائع” إلى الرموز المميزة مثل “fan” و “tas” و “tic” ، على سبيل المثال.)

على سبيل المثال ، في ضوء المطالبة “ما هي بعض أفكار الحفلات الشيقة لعيد ميلادي الثلاثين؟” يمكن للمطور أن يختار إلحاق هذه المطالبة بمطالبة إضافية مثل “أنت روبوت محادثة ممتع مصمم لمساعدة المستخدمين في الإجابة عن الأسئلة التي يطرحونها. يجب أن تجيب بصدق وبطريقة ممتعة! ” أو “أنت روبوت” قبل أن تقوم واجهة برمجة تطبيقات ChatGPT بمعالجتها. تساعد هذه التعليمات في تخصيص – وتصفية – استجابات نموذج ChatGPT بشكل أفضل ، وفقًا لبروكمان.

“نحن ننتقل إلى واجهة برمجة تطبيقات ذات مستوى أعلى. إذا كانت لديك طريقة أكثر تنظيماً لتمثيل المدخلات إلى النظام ، حيث تقول ، “هذا من المطور” أو “هذا من المستخدم” … يجب أن أتوقع ، بصفتك مطورًا ، أن تكون أكثر قوة [ باستخدام ChatML] ضد هذه الأنواع من الهجمات السريعة ، “قال بروكمان.

هناك تغيير آخر سيمنع (نأمل) منع سلوك ChatGPT غير المقصود وهو تحديثات النموذج الأكثر تكرارًا. مع إصدار gpt-3.5-turbo ، سيتم ترقية المطورين تلقائيًا تلقائيًا إلى أحدث طراز مستقر من OpenAI ، كما يقول بروكمان ، بدءًا من gpt-3.5-turbo-0301 (الذي تم إصداره اليوم). سيكون لدى المطورين خيار البقاء مع نموذج أقدم إذا اختاروا ذلك ، على الرغم من ذلك ، مما قد ينفي الميزة إلى حد ما.

سواء اختاروا التحديث إلى أحدث طراز أم لا ، يلاحظ بروكمان أن بعض العملاء – بشكل رئيسي الشركات الكبيرة ذات الميزانيات الكبيرة المقابلة – سيكون لديهم سيطرة أعمق على أداء النظام من خلال تقديم خطط مخصصة للسعة. تم تفصيله لأول مرة في الوثائق التي تم تسريبها في وقت سابق من هذا الشهر ، خطط السعة المخصصة لـ OpenAI ، والتي تم إطلاقها اليوم ، تتيح للعملاء الدفع مقابل تخصيص البنية التحتية الحاسوبية لتشغيل نموذج OpenAI – على سبيل المثال ، gpt-3.5-turbo. (بالمناسبة ، إنه أزور في النهاية الخلفية).

بالإضافة إلى “التحكم الكامل” في حمل المثيل – عادةً ما تحدث استدعاءات OpenAI API على موارد الحوسبة المشتركة – تمنح السعة المخصصة للعملاء القدرة على تمكين ميزات مثل حدود السياق الأطول. تشير حدود السياق إلى النص الذي يدرسه النموذج قبل إنشاء نص إضافي ؛ تسمح حدود السياق الأطول للنموذج “بتذكر” المزيد من النص بشكل أساسي. في حين أن حدود السياق الأعلى قد لا تحل جميع مشكلات التحيز والسمية ، إلا أنها قد تقود نماذج مثل gpt-3.5-turbo إلى الهلوسة بدرجة أقل.

يقول Brockman أن العملاء ذوي السعة المخصصة يمكنهم توقع نماذج gpt-3.5-turbo مع نافذة سياق تصل إلى 16 ألفًا ، مما يعني أنه يمكنهم الحصول على أربعة أضعاف عدد الرموز المميزة مثل نموذج ChatGPT القياسي. قد يسمح ذلك لشخص ما بلصق صفحات وصفحات رمز الضريبة والحصول على إجابات معقولة من النموذج ، على سبيل المثال – وهو إنجاز غير ممكن اليوم.

ألمح بروكمان إلى إصدار عام في المستقبل ، ولكن ليس في أي وقت قريب.

قال بروكمان: “بدأت نوافذ السياق في الظهور ، وجزء من سبب كوننا عملاء مكرسين – فقط في الوقت الحالي هو أن هناك الكثير من مقايضات الأداء من جانبنا”. “قد نتمكن في النهاية من تقديم نسخة من نفس الشيء عند الطلب.”

نظرًا لضغوط OpenAI المتزايدة لجني الأرباح بعد استثمار بمليارات الدولارات من Microsoft ، فلن يكون ذلك مفاجئًا للغاية.