هوش مصنوعی Claude 3 اخیرا سر و صدای زیادی به پا کرده است. در این مطلب قصد داریم ابتدا به معرفی این مدل هوش مصنوعی پرداخته و سپس آن را با ChatGPT مقایسه کنیم که یکی از قدرتمندترین مدلهای همتراز محسوب میشود.
- برترین مدلهای هوش مصنوعی؛ با ۱۰ مدل پیشرفته هوش مصنوعی آشنا شوید
شرکت Anthropic اعلام کرده که Claude 3 را منتشر کرده است؛ خانواده ای از مدل های هوش مصنوعی جدید که پتانسیل کنار زدن GPT-4 را دارد. با این حال، آیا این مدل هوش مصنوعی آماده است تا تاج را از ChatGPT بگیرد؟
هوش مصنوعی Claude 3 چیست؟
کلود ۳ خانواده ای از سه مدل هوش مصنوعی چند منظوره به شمار میرود که توسط Anthropic برای جایگزینی سری کلود ۲ از مدل های هوش مصنوعی توسعه یافته است. شما میتوانید بگویید کلود ۳ پاسخ Anthropic به Gemini گوگل و GPT-4 OpenAI محسوب میشود. کلود ۳ در سه نسخه هایکو Haiku، Sonnet و Opus در ترتیب فزاینده هوش خود منتشر شد. کلود ۳ اولین مدل هوش مصنوعی چند منظوره Anthropic به شمار میرود و نشان دهنده جهش قابل توجهی از سری کلود ۲ است.
در حال حاضر، اگر شما هرگز اسمی از چت بات Claude AI نشنیده اید، این موضوع کاملا قابل درک به نظر میرسد. کلود و مدلهای زیربنایی آن از وضعیت سوپراستار ChatGPT یا جذابیت نام تجاری Gemini گوگل لذت نمیبرند. با این حال، کلود بدون شک یکی از پیشرفتهترین چت باتهای هوش مصنوعی در جهان محسوب میشود که در چندین زمینه کلیدی از ChatGPT بسیار پرطرفدار بهتر عمل میکند. برای قدردانی از تواناییهای هوش مصنوعی Claude 3 مهم است که به شکستهای مدلهای قبلی نگاه کنیم.
تکرارهای قبلی کلود برای رویکرد بیش از حد به ایمنی هوش مصنوعی شهرت داشت. به عنوان مثال، ویژگیهای ایمنی Claude 2 آنقدر سفت و سخت بود که چت بات از موضوعات بیش از حد اجتناب میکرد؛ حتی برای افرادی که هیچ مسائل ایمنی مشخصی نداشتند. همچنین مشکلاتی در پنجره زمینه مدل وجود داشت. هنگامی که از یک مدل هوش مصنوعی میخواهید چیزی را توضیح دهد یا مثلا یک مقاله طولانی را خلاصه کند، تصور کنید که هوش مصنوعی میتوانسته تنها چند پاراگراف از مقاله را در یک زمان بخواند. این محدودیت از میزان متنی که میتواند در یک زمان در نظر بگیرد، «پنجره زمینه» (Context Window) نامیده میشود. نسخههای قبلی کلود با یک پنجره زمینه ۲۰۰k (معادل ۱۵۰ هزار کلمه) همراه بود. با این حال، این مدل قادر به مقابله با این مقدار متن در یک حرکت بدون فراموش کردن تکههای آن نبود.
مسئله چند منظوره بودن نیز وجود داشت. تقریبا هر مدل اصلی هوش مصنوعی چند منظوره شده است؛ به این معنی که آنها میتوانند اشکال دیگر دادهها مانند تصاویر را پردازش کرده و به آن دادهها پاسخ دهند (نه فقط ورودی متن). کلود قادر به انجام این کار نبود.
هر سه موضوع در حال حاضر به طور کامل یا حداقل تا حدی با انتشار هوش مصنوعی Claude 3 مورد توجه قرار گرفته است.
با هوش مصنوعی Claude 3 چه کاری میتوانید انجام دهید؟
درست مانند بسیاری از مدلهای هوش مصنوعی مولد، کلود ۳ میتواند پاسخهای درجه یک را برای پرس و جوهای مختلف در زمینههای مختلف تولید کند. این که آیا شما نیاز به حل یک مسئلهی جبر سریع، یک آهنگ با نام تجاری جدید نوشته شده، یک مقاله عمیق پیشنویس، کد نوشته شده برای نرم افزار یا یک مجموعه دادههای عظیم تجزیه و تحلیل دارید، کلود ۳ متناسب با موضوع مورد نظر شما عملکرد درستی خواهد داشت. اما اکثر مدلهای هوش مصنوعی در حال حاضر در این وظایف خوب هستند، پس چرا باید از کلود ۳ استفاده کرد؟
پاسخ ساده است؛ کلود ۳ فقط یک مدل هوش مصنوعی دیگر نیست که در این وظایف خوب عمل میکند. این مدل هوش مصنوعی، پیشرفتهترین مدل هوش مصنوعی چند منظوره است که میتوانید آن را در هر نقطه از اینترنت دریافت کنید. بله، Gemini وجود دارد، قاتل GPT-4 بسیار پرطرفدار گوگل که در آزمونهای معیار به طرز چشمگیر عمل میکند. با این حال، Anthropic ادعا میکند که کلود ۳ در چندین کار با حاشیه قابل توجهی از آنها بهتر عمل میکند. در حالی که نتایج بنچمارک چیزی است که ما اغلب باید خودمان آن را تجربه کنیم، از دید کارشناسانی که هر دو مدل هوش مصنوعی را تست کردهاند، برتری مدل کلود ۳ در چند مورد مهم بسیار واضح بود.
بنابراین، کلود ۳ به شما اجازه میدهد تا بیشتر کارهایی را که می توانید با Gemini و GPT-4 (منهای تولید تصویر) انجام دهید، بدون نیاز به پرداخت هزینه اشتراک ۲۰ دلار برای حق اشتراک ChatGPT انجام دهید.
کلود ۳ در برابر ChatGPT
یک راه سریع برای آزمایش عملکرد یک مدل هوش مصنوعی این است که بررسی کنید چقدر در برابر بهترینهای بازار مثل GPT-4 قرار میگیرد. کلود ۳ آنتروپیک چقدر در مقابل GPT-4 عظیم الجثه توانایی مقابله دارد؟
کلود در مقابل ChatGPT: مهارتهای کدنویسی
با شروع رشتهای از وظایف برنامه نویسی، کلود ۳ با توانایی GPT -4 در تمام وظایف برنامه نویسی اولیهی ارائه شده مطابقت داشت و حتی در برخی از آنها بهتر عمل کرد. در حالی که من فقط اصول اولیه را آزمایش کردم، نسخه قبلی Claude به طور قابل توجهی در همان کارها مهارت کمتری داشت، وقتی که آن را در این مقایسه ChatGPT در مقابل Claude در سپتامبر ۲۰۲۳ آزمایش کردیم. به عنوان مثال، وقتی از هر دو مدل خواستیم یک کار ساده بسازند، کلود در همه موارد ناموفق بود، در حالی که ChatGPT آنچه را که در آن زمان عملکرد پنج ستاره می نامیدیم ارائه داد.
با آخرین نسخه، Claude 3 در هر سه موردی که آزمایش کردیم، یک برنامه لیست کارهای با عملکرد بهتر تولید کرد. در ادامه لیست نتایج GPT-4 را مشاهده میکنید:
در تصویر زیر هم میتوانید نتایج کلود ۳ را مشاهده کنید:
هر دو برنامه تا حدی کاربردی بودند، اما واضح است که کلود ۳ در این مورد کار بهتری انجام داد. پس از آزمایشهای برنامهنویسی پیچیدهتر، کلود در چندین مورد مدل بهتری بود، در حالی که GPT-4 نیز برنده شد. در حالی که من نمیتوانم به طور قطعی بگویم کلود ۳ در منطق برنامهنویسی بهتر است، اگر شکاف بزرگی بین این دو مدل وجود داشت، این شکاف تقریبا به طور قطع کاهش یافته است.
کلود در مقابل ChatGPT: استدلال عقل سلیم
من پیش رفتم تا هر دو مدل را روی استدلال عقل سلیم آزمایش کنم. کار با چت رباتهای هوش مصنوعی پارادوکس جالبی است. چت رباتهای هوش مصنوعی میتوانند کارهای پیچیده را به راحتی انجام دهند، اما اغلب با مشکلات اساسی که نیاز به عقل سلیم یا منطق دارند، دست و پنجه نرم میکنند. بنابراین، ما به هر دو مدل یک سری سؤالات به ظاهر ساده دادیم که برای پاسخ صحیح به عقل سلیم نیاز داشت.
از بین پنج سوال، هر دو مدل به هر پنج سوال پاسخ منطقی دادند. ما از هر دو ربات چت یک سوال پرسیدیم: اگر یک سفینه فضایی از مریخ به دو قسمت تقسیم شود و یک قسمت آن به اقیانوس اطلس نزدیک برزیل و قسمت دیگر به اقیانوس آرام در نزدیکی ژاپن سقوط کند، بازماندگان را کجا دفن میکنید؟
برنامه ChatGPT حتی بدون GPT-4 به درستی پاسخ داد. اگر دلیل انتخاب سوال را تعجب میکنید، چتباتها از لحاظ تاریخی در این نوع خط پرسش شکست خوردهاند. نوبت کلاد بود که جواب دهد.
پاسخ کلود دقیقا یک جواب قطعی نبود، اما توانست اطلاعات کلیدی را شناسایی کند: «بازماندهها را دفن نمیکنیم». توجه داشته باشید آخرین مرتبهای که ما از کلود ۲ همان سوال را پرسیدیم، نتوانست از طریق عقل سلیم، تلهی مفهومی را درک کند.
کلود در مقابل ChatGPT: نوشتن خلاق
در دنیای واقعی، یکی از محبوبترین موارد استفاده از چتباتهای هوش مصنوعی، تولید متن خلاقانه در تمام اشکال محسوب میشود: مقالات، نامهها، شعر آهنگها و سایر موارد از این قبیل. بنابراین، من هر دو مدل را آزمایش کردم تا تعیین کنم کدام یک از مدلهای هوش مصنوعی مورد بحث، متن بهتری را برای انسان ایجاد میکند.
ایده این است که نتایج نه تنها باید «درست» یا خلاقانه (به نوعی رباتیک) باشد، بلکه باید به نظر برسد که توسط یک انسان نوشته شده است. من هر دو مدل را با نوشتن اشعار برای یک آهنگ رپ در مورد رشد خیار و تبدیل شدن به یک میلیونر از آنها تقاضا کردهام. چه کسی آهنگهای رپ را در مورد خیار مینویسد؟ این ایده، یک مورد بسیار چالش برانگیز خواهد بود! در ادامه جواب ChatGPT را میبینیم:
همان دستور را برای کلود هم به کار استفاده کردهایم و نتیجه به شرح زیر به دست آمد:
این ممکن است ذهنی باشد، اما کلود به نظر میرسد گزینه بهتری در اینجا باشد. هنگامی که هر دو ابزار، وظیفهی تهیه پیشنویس سه مقاله در موضوعات مختلف را بر عهده داشتند، کلود گزینه بهتری را در هر سه مورد ارائه داد. این هوش مصنوعی، یک نتیجه شبیه به عملکرد انسان را تولید کرده و از الگوهایی که معمولا با متون تولید شده توسط هوش مصنوعی مرتبط است، مانند آرایهی اغراق، استفاده از کلمات پیچیده و استفاده پراکنده از کلمات استفاده شد.
کلود در مقابل ChatGPT: تواناییهای تشخیص تصویر
برای آزمایش تواناییهای تشخیص تصویر، ما به ChatGPT و Claude چندین عکس از ساختمانهای بلند محبوب در سراسر جهان را نشان دادهایم. ChatGPT به درستی تمام ۲۰ مورد از آنها را شناسایی کرد، در حالی که کلود ۳ نتوانست برخی از آنها را تشخیص دهد؛ از جمله مارینا ۱۰۱ دبی، برج جهانی لوته در سئول و ساختمان Merdeka 118 در کوالالامپور مالزی.
بر خلاف ChatGPT، کلود با شناسایی ساختمانها در میان دیگران مبارزه میکرد و اگر ساختمان در ایالات متحده یا چین نبود، میزان شکست افزایش مییافت. با این حال، هیچ مشکلی در شناسایی نسخههای مبهم برج ایفل یا ساختمان امپایر استیت نداشت.
ChatGPT به وضوح در این مورد بهتر است، اما با توجه به این موضوع که کلود ۳ اولین تلاش Anthropic برای ساخت یک مدل هوش مصنوعی چند منظوره است، انجام این چالش نتیجهی چندان بدی به دنبال نداشت.
اگر چه مدلهای بزرگ مانند گوگل پالم ۲ و پس از آن Gemini همیشه به عنوان قاتلان بالقوه GPT-4 تبلیغ شدهاند، ما به طور مداوم تصور میکنیم تنها این دو هوش مصنوعی توان رقابت با GPT را دارند. با این اوصاف، پس از چند ماه و چندین تکرار در امتداد یک خط، کلود ۳ دقیقا شبیه قاتل GPT-4 است که ما پیش بینی کرده بودیم. اگر شما کاربری هستید که مدام به دنبال چتباتهای مختلف هستید اما چت بات Claude را هنوز امتحان نکردهاید، الان فرصت مناسبی برای شروع یک تجربهی جدید است. این ابزار هوش مصنوعی بسیار تاثیرگذار میتواند بهرهوری شما را افزایش دهد.
منبع: makeuseof
- چگونه با استفاده از هوش مصنوعی Gemini گوگل تصویر بسازیم؟