هوش مصنوعی مولد یا زایا که ترجمه انگلیسی آن مترادف است با Generative artificial intelligence. نوعی هوش مصنوعی است که در پاسخ به فرمان کاربر، قادر به تولید متن، تصاویر یا دیگر رسانه است. مدل های هوش مصنوعی مولد الگوها و ساختار داده های آموزشی ورودی خودرا یاد میگیرند و سپس داده های جدید تولید میکنند. هوش مصنوعی مولد کاربردهای بالقوه ای در طیف گسترده ای از صنایع از جمله نوشتن، توسعه نرم افزار، مراقبت های بهداشتی،مالی،بازی،هنر، مد و بازاریابی دارد. در اوایل سال 2020 گوگل و باید و به همراه چندین شرکت دیگر مدل های هوشمند مولد را توسعه دادند. بااین حال، نگرانی هایی در مورد سوء استفاده احتمالی از هوش مصنوعی مولد مانند ایجاد اخبار جعلی یا جعل عمیق وجود دارد که میتواند برای فریب دادن یا دستکاری مردم استفاده شود.
رشته دانشگاهی هوش مصنوعی در یک کارگاه تحقیقاتی که در سال 1956 در کالج دارتموث برگزار شد، تأسیس شد و در دهههای پس از آن، چندین موج پیشرفت و خوشبینی را تجربه کرده است. از بدو پیدایش، محققان در این زمینه بحثهای فلسفی و اخلاقی را در مورد ماهیت ذهن انسان و پیامدهای ایجاد موجودات مصنوعی با هوش انسانمانند مطرح کردهاند.
این موضوعات قبلاً توسط اسطوره، داستان و فلسفه از دوران باستان مورد بررسی قرار گرفته است. مفهوم هنر خودکار حداقل به اتوماتای تمدن یونان باستان برمی گردد، جایی که مخترعانی مانند Daedalus و Hero of Alexandria ماشین هایی طراحی کردند که قادر به نوشتن متن، تولید صداها و پخش موسیقی بودند. سنت خودکارهای خلاقانه در طول تاریخ شکوفا شده است، که نمونه آن اتومات مایلاردت است که در اوایل دهه 1800 ایجاد شد. هوش مصنوعی ایده ای است که از اواسط قرن بیستم جامعه را مجذوب خود کرده است. این کار با داستان های علمی تخیلی شروع شد که جهان را با این مفهوم آشنا میکرد، اما این ایده به طور کامل به روش علمی دیده نشد تا اینکه آلن تورینگ، یک متخصص چندمعنا، در مورد امکان سنجی این مفهوم کنجکاو شد. این مقاله پیشگامانه تورینگ در سال 1950 با عنوان «ماشینهای محاسباتی و هوش» سؤالات اساسی در مورد استدلال ماشینی مشابه هوش انسانی مطرح کرد و به طور قابل توجهی به پایههای مفهومی هوش مصنوعی کمک کرد. توسعه هوش مصنوعی در ابتدا به دلیل هزینه های بالا و این واقعیت که رایانه ها قادر به ذخیره دستورات نبودند، خیلی سریع نبود.
این امر در طول پروژه تحقیقاتی تابستانی دارتموث در سال 1956 در زمینه هوش مصنوعی تغییر کرد، جایی که یک فراخوان الهام بخش برای تحقیق در زمینه هوش مصنوعی وجود داشت، که سابقه ای را برای دو دهه پیشرفت سریع در این زمینه ایجاد کرد. از زمان تأسیس هوش مصنوعی در دهه 1950، هنرمندان و محققان از هوش مصنوعی برای خلق آثار هنری استفاده کردند. در اوایل دهه 1970، هارولد کوهن در حال خلق و نمایش آثار مولد هوش مصنوعی بود که توسط AARON، برنامه رایانهای که کوهن برای تولید نقاشی ایجاد کرد. زنجیرههای مارکوف از زمان توسعه آنها توسط ریاضیدان روسی آندری مارکوف در اوایل قرن بیستم، مدتهاست که برای مدلسازی زبانهای طبیعی مورد استفاده قرار گرفتهاند. مارکوف اولین مقاله خود را در مورد این موضوع در سال 1906 منتشر کرد، و الگوی حروف صدادار و صامت ها را در رمان یوگنی اونگین با استفاده از زنجیره های مارکوف تحلیل کرد. هنگامی که یک زنجیره مارکوف بر روی یک پیکره متنی آموخته میشود، میتوان از آن به عنوان یک تولید کننده متن احتمالی استفاده کرد. حوزه یادگیری ماشین اغلب از مدلهای آماری، از جمله مدلهای تولیدی، برای مدلسازی و پیشبینی دادهها استفاده میکند. با شروع در اواخر دهه 2000،ظهور یادگیری عمیق باعث پیشرفت و تحقیق در طبقه بندی تصاویر، تشخیص گفتار، پردازش زبان طبیعی و سایر وظایف شد. شبکه های عصبی در این دوران به دلیل دشواری مدل سازی مولد، معمولاً به عنوان مدل های متمایز آموزش داده میشدند. در سال 2014، پیشرفتهایی مانند رمزگذار خودکار متغیر و شبکه متخاصم مولد، اولین شبکههای عصبی عمیق کاربردی را تولید کردند که قادر به یادگیری مدلهای مولد، بر خلاف مدلهای متمایز، برای دادههای پیچیده مانند تصاویر بودند. این مدلهای مولد عمیق اولین مدلهایی بودند که نه تنها برچسبهای کلاس را برای تصاویر، بلکه کل تصاویر را نیز تولید کردند.
در سال 2017، شبکه ترانسفورماتور پیشرفتهایی را در مدلهای مولد در مقایسه با مدلهای قدیمیتر حافظه کوتاهمدت فراهم کرد، که منجر به اولین ترانسفورماتور از پیش آموزشدیده مولد (GPT)، معروف به GPT-1، در سال 2018 شد. این در سال 2019 توسط GPT-2 دنبال شد که توانایی تعمیم بدون نظارت را به بسیاری از وظایف مختلف به عنوان یک مدل بنیادی نشان داد. در سال 2021، انتشار DALL-E، یک مدل مولد پیکسل مبتنی بر ترانسفورماتور، و به دنبال آن Midjourney و Stable Diffusion، ظهور هنر هوش مصنوعی کاربردی با کیفیت بالا را از درخواستهای زبان طبیعی نشان داد. در مارس 2023، GPT-4 منتشر شد.
تیمی از تحقیقات مایکروسافت استدلال کردند که "به طور منطقی میتوان آن را به عنوان یک نسخه اولیه (اما هنوز ناقص) از یک سیستم هوش مصنوعی عمومی (AGI) در نظر گرفت".سایر محققان در مورد رسیدن GPT-4 به این آستانه مناقشه کرده اند و هوش مصنوعی مولد را "هنوز تا رسیدن به معیار "هوش عمومی انسان" در سال 2023 بسیار دور میدانند. در سال 2023، متا یک مدل هوش مصنوعی به نام ImageBind منتشر کرد که دادههای متن، تصاویر، ویدئو، دادههای حرارتی، دادههای سهبعدی، صدا و حرکت را ترکیب میکند که انتظار میرود محتوای هوش مصنوعی مولد همه جانبهتری را فراهم کند. طبق نظرسنجی SAS و Coleman Parkes Research، چین در پذیرش هوش مصنوعی مولد در جهان پیشتاز است، به طوری که 83 درصد از پاسخ دهندگان چینی از این فناوری استفاده میکنند که از میانگین جهانی 54 درصد و ایالات متحده با 65 درصد فراتر رفته است.
یک گزارش سازمان ملل نشان داد که چین بیش از 38000 پتنت GenAI را از سال 2014 تا 2023 ثبت کرده است که بسیار بیشتر از ایالات متحده است. نمونه اولیه هوش مصنوعی مولد مدل ساده ای بود که به نام زنجیره مارکوف شناخته میشد. یک ریاضیدان روسی به نام آندری مارکوف در سال 1906 این روش آماری را برای مدلسازی رفتار فرآیندهای تصادفی معرفی کرد. این مدل مارکوف مدت طولانی است که در برنامه های ایمیل برای پیش بینی کلمه بعدی و تکمیل خودکار متن استفاده میشود و به مرور زمان در دهه 1960 در چت بات ها معرفی شد. چت ربات زایا ELIZA که توسط جوزف وایزنبام طراحی شد، یکی از اولین نمونه های این تکنولوژی بود که به دلیل محدود بودن واژگان و اتکای بیش از حد به الگوها خیلی زود شکست خورد.
اما در سال 2010 در پی پیشرفت شبکه های عصبی و یادگیری عمیق شاهد تجدید حیات هوش مصنوعی مولد بودیم. در سال 2014 یک معماری یادگیری ماشین معروف به شبکه های تخاصمی مولد توسط محققان دانشگاه مونترال پیشنهاد شد; مدل مولد برای تولید نمونه های جدید آموزش داده میشود و مدل متمایز کننده تلاش میکند تا نمونه ها را در دو دسته واقعی ( از دامنه ) یا جعلی ( تولید شده) قرار دهد. در این روش شبکه فرا میگیرد که چگونه از داده های آموزش داده شده، داده های جدیدی به وجود بیاورد که از دید آماری با داده های آموزشی همسان باشند. از آن زمان تا کنون، پیشرفت های بسیاری در تکنیک های شبکه های عصبی حاصل شده است که همه آنها موجب پیشرفت این فناوری نوین شده اند. از جمله این تکنیک ها میتوان به ترنفورماتور ها، حافظه کوتاه مدت، حافظه بلند مدت؛ مدل های انتشار، میدان های تابشی عصبی و VAE ها اشاره کرد.
این نوع هوش مصنوعی با یک اعلان که به آن پرامپت prompt گفته میشود، کارش را شروع میکند. این اعلان میتواند در فرمت های تصویر،متن،ویدیو،طراح گرافیکی، نت موسیقی یا هرچیز دیگری باشد. البته هرچیزی که هوش مصنوعی قابلیت پردازش آن را داشته باشد. بعد از دریافت ورودی ها، الگوریتم های هوش مصنوعی دست به کار میشوند تا نتیجه در خواست شمارا بر گردانند. محتوایی که توسط هوش مصنوعی در پاسخ ایجاد میشود نیز میتواند یک مقاله، تصویر، ویدیو یا صدا باشد. نسخه های اولیه این فناوری به اندازه الان پیشرفته نبود که به آن بتوانید داده ای را ارسال کنید، باید از یک API یا فرآیندهای پیچیده تر استفاده میکردید. توسعه دهندگان این نوع از هوش مصنوعی باید با زبان برنامه نویسی پایتون و ابزار های مختلف هوش مصنوعی آشنا میشدند. توسعه دهندگان هوش مصنوعی خواب های زیادی برای این تکنولوژی نوین و کار راه انداز دیده اند و همچنان به توسعه آن ادامه میدهند. این جاه طلبی و ایده آل گرایی محققان باعث میشود تا شما بتوانید درخواست هایتان را به زبان ساده و خودمانی بگویید و از آن خروجی های ساده و روان تری دریافت کنید.
هوش مصنوعی مولد یا زایا به طور گسترده در بسیاری از زمینه های کسب و کار مورد استفاده میگیرد. مزایای هوش مصنوعی مولد شامل توسعه سریع تر محصول، افزایش تجربه مشتری و بهبود بهره وری کارکنان است. در نظر سنچی اخیر گارتنر از بیش از 2500 مدیر،38 درصد بیان کردند که بهبود تجربه و حفظ مشتری هدف اصلی سرمایه گذاری های آنها در هوش مصنوعی مولد است. به دنبال آن رشد در آمد (26%)، بهینه سازی هزینه (17%) و تداوم کسب وکار (7%) از جمله اهداف مهم دیگر میباشند. نظر سنجی کی پی ام جی نیز در سال 2023 نشان میدهد که در همه صنایع، بیش از سه چهارم مدیران اجرایی (77 درصد) هوش مصنوعی مولد را تا حد زیادی تاثیر گذارترین فناوری نو ظهور مورد استفاده میدانند و 71 درصد قصد دارند اولین راه حل هوش مصنوعی مولد خودرا ظرف دوسال آینده اجرا کنند. قابلیت های هوش مصنوعی مولد برای تغییر نحوه تولید محتوا، تعامل با کاربران، توسعه نرم افزار و تحلیل گری داده ها توسط شرکت ها بی حد و حصر به نظر میرسد. هوش مصنوعی مولد فرصت های جدیدی را برای افزایش درآمد،کاهش هزینه ها و مدیریت بهتر ریسک فراهم میکند یکسری از مزایای بالقوه پیاده سازی هوش مصنوعی مولد شامل موارد ذیل است.
این نوع از هوش مصنوعی را میتوان برای تولید هر نوع محتوایی استفاده کرد. خوشبختانه فناوری هایی مانند بارد و چت جی پی تی کاری کرده اند که همه افراد بتوانند از این فناوری استفاده کنند و برای همه افراد در دسترس باشد.
شبکههای عصبی
شبکههای عصبی ستون فقرات هوش مصنوعی مولد هستند و به ویژه مدلهای یادگیری عمیق از مجموعه دادههای بزرگ برای فهمیدن و بازتولید الگوها استفاده میکنند.
دادههای آموزشی
مدلهای هوش مصنوعی مولد با مجموعه دادههای عظیمی مانند متن از کتابها، مقالات و تصاویر آموزش داده میشوند. این دادهها برای آموزش مدلها دربارهی ریزهکاریهای زبان، ساختار و زمینه بسیار مهم هستند.
مدل GPT یکی از پیشرفتهترین مدلهای مولد است که توسط OpenAI توسعه یافته و بر اساس معماری ترنسفورمر طراحی شده است. این مدل در تولید متن بر اساس ورودیهای داده شده تخصص دارد و از یادگیری عمیق برای تولید پاسخهایی که بسیار شبیه به زبان انسانی هستند، استفاده میکند. GPT با استفاده از دادههای متنی عظیم از اینترنت آموزش دیده است و میتواند به خوبی پاسخهای متنی، ترجمههای زبانی، خلاصهسازی متن و حتی نوشتن مقالات کامل را انجام دهد. این مدل در نسخههای مختلفی مانند GPT-2 و GPT-3 منتشر شده است که هر کدام با افزایش تعداد پارامترها و بهبود عملکرد عرضه شدهاند. GPT-3 به ویژه به دلیل تواناییهای چندمنظوره و دقیق خود در تولید محتوا به شهرت جهانی دست یافته است.
شبکههای مولد متخاصم یا GANs یکی از مدلهای محبوب در تولید تصاویر و ویدیوهای واقعی هستند. این مدلها توسط ایان گودفلو و همکارانش در سال 2014 معرفی شدند و بر اساس یک سیستم دو بخشی کار میکنند: یک مولد و یک متمایزکننده. مولد وظیفه دارد تصاویر جعلی تولید کند، در حالی که متمایزکننده سعی میکند این تصاویر را از تصاویر واقعی تشخیص دهد. از آنجا که این دو شبکه در تعامل با یکدیگر قرار میگیرند، مولد به تدریج بهبود مییابد و تصاویری تولید میکند که تقریباً غیرقابل تشخیص از تصاویر واقعی هستند. از GANs به طور گستردهای در خلق تصاویر واقعی، ویدیوهای مصنوعی، و حتی در هنر دیجیتال استفاده میشود. این مدلها در تولید تصاویر چهرههای انسانی، مناظر، و حتی در سبکهای مختلف هنری کاربرد دارند.
VAEs (Variational Autoencoders :
خودرمزگذارهای متغیر یا VAEs یک نوع خاص از مدلهای مولد هستند که برای تولید دادههایی با ویژگیهای خاص مفید میباشند. برخلاف GANs که روی تولید تصاویر واقعی تمرکز دارند، VAEs بیشتر بر روی فهم و مدلسازی ساختارهای نهفته در دادهها کار میکنند. VAEs با ترکیب ایدههایی از یادگیری عمیق و احتمالات، قادر به تولید دادههای جدید هستند که به طور آماری با دادههای آموزشی همخوانی دارد. این مدلها به خصوص در کاربردهایی مانند فشردهسازی دادهها، بازسازی تصاویر با کیفیت پایین، و تولید دادههای جدید در محدودههای خاص مفید هستند. به عنوان مثال، VAEs میتوانند تصاویر جدیدی از چهرههای انسانی تولید کنند که هرگز وجود نداشتهاند، اما به شدت شبیه به نمونههای واقعی هستند.
ابزار های هوش مصنوعی مولد یا زایا برای داده های مختلف مانند تصویر،متن،موسیقی، صدا و کد وجود دارد به طور مثال در زیر به برخی از آنها اشاره شده است :
بستن *نام و نام خانوادگی * پست الکترونیک * متن پیام |
021-55529569 مشاوره رایگان محصولات
بستن ورود به کاربری
نام کاربری (ایمیل شما)
رمز عبور
نام کاربری (ایمیل شما)
کد امنیتی :
ورود
آیا کلمه عبور خود را فراموش کرده اید ؟
ارسال
بازگشت به ورود.
می خواهید ثبت نام کنید ؟ عضویت |