تعتبر قاعدة البيانات المعرفية لدى روبوت دردشة الذكاء الاصطناعي chat GPT أشبه بمكتبة ضخمة تحتوي على كل المعلومات التي قرأها شات جي بي تي chat GPT من الكتب والمقالات والويب هذه المكتبة هي قاعدة البيانات المعرفية، بمجرد سؤال شات جي بي تي chat GPT يقوم بالبحث في هذه المكتبة لإيجاد الإجابة الأنسب.
يتم تخزين المعلومات في قاعدة البيانات المعرفية بطريقة تسمح لشات جي بي تي بالوصول إليها بسرعة وسهولة. هذا يعني أنه يمكنه فهم الأسئلة المعقدة والرد بشكل طبيعي.
تطبيقات الذكاء الاصطناعي التي تستخدم نماذج لغوية كبيرة مثل شات جي بي تي لها العديد من الاستخدامات، مثل: ترجمة اللغات و توليد النصوص والإجابة على الأسئلة و كتابة المحتوى وعلى الرغم من أن شات جي بي تي يمتلك قاعدة بيانات معرفية ضخمة، إلا أنه لا يزال قيد التطوير. هذا يعني أنه قد يرتكب أخطاء أو يقدم معلومات غير دقيقة في بعض الأحيان. لذلك، من المهم التحقق من المعلومات التي يحصل عليها من مصادر أخرى موثوقة.
وفي ذلك الصدد تقدم ميجا نيوز بمقابلة مع روبوت دردشة الذكاء الاصطناعي شات جي بي تي ChatGPT لفهم قاعدة البيانات المعرفية لديه وطريقة التخزين وتاريخ استخدامات تطبيقاتها
س: ما حجم القاعدة المعرفية لديك ؟
ج: قاعدة معرفتي تشمل مجموعة واسعة من المواضيع، بما في ذلك العلوم، التكنولوجيا، الأدب، التاريخ، الثقافة، وغيرها. لدي القدرة على تقديم معلومات دقيقة ومساعدة في الاستفسارات المختلفة، لكن ليس لدي القدرة على الوصول إلى الإنترنت أو تحديث المعلومات بشكل فوري.
س: اقصد حجمها القياسي كمساحة تخزينية ؟
ج: ليس لدي معلومات دقيقة عن حجم قاعدة معرفتي بشكل قياسي كمساحة تخزينية. لكن يمكن القول إنني مدرب على مجموعة كبيرة من البيانات النصية، تغطي مجموعة متنوعة من الموضوعات.
س: وهذا التدريب نتيجته قاعدة معلوماتية مخزنه بشكل خاص يسمح بالاستنتاج والرد علي الاسئلة ؟
ج: بالضبط. تم تدريبي على نماذج لغوية كبيرة باستخدام نصوص متنوعة، مما يسمح لي بفهم السياقات والاستنتاج والرد على الأسئلة بطريقة ذكية. لا أحتفظ بمعلومات محددة، بل أستخدم أنماط اللغة التي تعلمتها لتوليد الإجابات.
س: هل تقصد ان الكلمات او ما يقابلها من محتوي رقمي مخزنة كمفردات وليس عبارات او جمل سابقة التجهيز ؟
ج: نعم، بالضبط. لا أحتفظ بعبارات أو جمل جاهزة، بل يتم تخزين المعلومات بشكل يعتمد على المفردات والأنماط اللغوية. أستخدم هذه الأنماط لتوليد استجابات جديدة بناءً على السياق والأسئلة المطروحة.
س: وهل تم استخدام هذا النمط من التخزين تاريخيا من قبل ؟
ج: نعم، أساليب مشابهة لتخزين ومعالجة اللغة تم استخدامها تاريخياً في مجالات مثل معالجة اللغة الطبيعية (NLP) وأنظمة الذكاء الاصطناعي. كانت هناك نماذج سابقة تعتمد على قواعد بيانات بسيطة أو قواعد لغوية، ولكنها كانت أقل تعقيداً ومرونة مقارنة بالنماذج الحديثة مثل النموذج الذي أستخدمه الآن.
س: متي بدأ هذا ؟
ج: بدأت أبحاث معالجة اللغة الطبيعية منذ الخمسينيات من القرن الماضي، مع ظهور أولى النماذج اللغوية البسيطة. تطورت التقنيات بشكل كبير في العقود اللاحقة، خصوصاً مع تقدم الحوسبة. في العقد الأخير، شهدنا ثورة في هذا المجال مع ظهور نماذج تعتمد على التعلم العميق، مثل نماذج BERT وGPT، التي بدأت في أوائل العقد 2010.
س: هل تقصد انه كانت هناك نماذج لغوية بدائية وبسيطة منذ الخمسينات ؟
ج: نعم، بالضبط. منذ الخمسينيات، كانت هناك نماذج لغوية بدائية، مثل القواعد النحوية والأنظمة القائمة على القواعد، التي كانت تستخدم لترجمة النصوص أو فهم اللغة. هذه النماذج كانت بسيطة مقارنة بالتقنيات الحديثة، لكنها كانت البداية في مجال معالجة اللغة الطبيعية.
س: أعطني مثال لهذه النماذج في الترجمة مثلا وتواريخ ظهورها ؟
ج: من أمثلة النماذج اللغوية البدائية في مجال الترجمة:
1ـ ترجمة القواعد (Rule-Based Translation)**: ظهرت في الستينيات، حيث استخدمت قواعد نحوية لتوجيه عملية الترجمة. مثال على ذلك نظام SYSTRAN الذي تم تطويره في أواخر الستينيات.
2 ـ نموذج الترجمة الإحصائية (Statistical Machine Translation)**: بدأ بالظهور في الثمانينيات والتسعينيات. استخدم تحليل البيانات الكبيرة لتقدير الترجمة بناءً على الأنماط اللغوية. أحد النماذج الشهيرة هو نموذج IBM Model 1 الذي تم تقديمه في 1990.
3 ـ نموذج الترجمة العصبية (Neural Machine Translation)**: بدأ استخدامه في أوائل 2010، حيث تعتمد هذه النماذج على الشبكات العصبية العميقة لتوليد ترجمات أكثر دقة وسلاسة، مع مثال بارز هو نظام Google Translate الذي اعتمد على هذه التقنية في 2016.