Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd که معمولاً به عنوان DeepSeek شناخته میشود (به چینی: 深度求索؛ پینیین: Shēndù Qiúsuǒ) یک شرکت هوش مصنوعی چینی است که مدل های زبان بزرگ منبع باز (LLM) را توسعه میدهد. مستقر در هانگژو، ژجیانگ، متعلق به صندوق تامینی چینی High-Flyer است که یکی از بنیانگذاران آن، لیانگ ونفنگ، شرکت را در سال 2023 تاسیس کرد و به عنوان مدیر عامل آن فعالیت میکند.
مدل DeepSeek-R1 پاسخ هایی را ارائه میدهد که با سایر مدل های زبان بزرگ معاصر مانند GPT-4o و o1 OpenAI قابل مقایسه است. این آموزش با هزینه بسیار کمتری انجام میشود - 6 میلیون دلار آمریکا در مقایسه با 100 میلیون دلار برای GPT-4 OpenAI در سال 2023 و به یک دهم قدرت محاسباتی یک LLM قابل مقایسه نیاز دارد. مدلهای هوش مصنوعی DeepSeek در بحبوحه تحریمهای ایالات متحده بر چین برای تراشههای انویدیا،توسعه یافتند که هدف آن محدود کردن توانایی کشور برای توسعه سیستمهای هوش مصنوعی پیشرفته بود.
دیپسیک با انتشار ناگهانی مدل DeepSeek-R1 با قابلیتهای پیشرفته، توجهات جهانی را جلب کرد. این مدل با هزینهای بهمراتب کمتر، به رقیبی جدی برای مدلهای گرانقیمت غربی تبدیل شده و بسیاری آن را هوش مصنوعی جایگزین چت جی بی تی میشناسند. تأثیر ساختهی چینیها بهقدری گسترده بود که حتی دونالد ترامپ، رئیسجمهور جدید آمریکا، آن را «زنگ خطری» برای سلطهی این کشور بر هوش مصنوعی دانست.
در 10 ژانویه 2025، DeepSeek اولین برنامه چت بات رایگان خود را بر اساس مدل DeepSeek-R1 برای iOS و Android منتشر کرد. در 27 ژانویه، DeepSeek-R1 از ChatGPT پیشی گرفت و به عنوان پربارگیری ترین برنامه رایگان در فروشگاه App iOS در ایالات متحده،پیشی گرفت و باعث شد که قیمت سهام انویدیا 18٪ کاهش یابد. موفقیت DeepSeek در برابر رقبای بزرگتر و معتبرتر به عنوان "هوش مصنوعی معلق" توصیف شده است،که "اولین شلیک به آنچه به عنوان یک مسابقه فضایی هوش مصنوعی جهانی در حال ظهور است" است، و آغازگر "عصر جدیدی از هوش مصنوعی است"
DeepSeek الگوریتمها، مدلها و جزئیات آموزشی مولد هوش مصنوعی خود را به صورت متنباز میسازد و به کد آن اجازه میدهد تا برای استفاده، اصلاح، مشاهده و طراحی اسناد برای اهداف ساختمانی آزادانه در دسترس باشد. طبق گزارشها، این شرکت به شدت از محققان جوان هوش مصنوعی از دانشگاههای برتر چینی استخدام میکند، و از خارج از حوزه علوم رایانه برای تنوع بخشیدن به دانش و تواناییهای مدلهای خود استخدام میکند.
مدلهای دیپسیک، متنباز و رایگان هستند و کاربران میتوانند مدلهای سبکتر را روی سیستمهای معمولی اجرا کنند. کسانی که امکان دانلود هوش مصنوعی دیپ سیک و اجرای محلی مدلها را ندارند، میتوانند از چتبات رسمی دیپسیک استفاده کنند که با قابلیتهایی مانند آپلود فایل، جستوجوی وب و ویژگی DeepThink (برای تحلیل عمیقتر قبل از پاسخگویی بر پایهی مدل R1) در نسخهی وب و اپلیکیشنهای اندروید و iOS ارائه میشود.
برخلاف همتایان غربی که استفادهی رایگان از آنها محدودیتهای زیادی دارد، هوش مصنوعی چینی جدید کاملاً رایگان بوده و از زبان فارسی نیز بهخوبی پشتیبانی میکند. از همه مهمتر، چتبات دیپسیک تحریم نیست و میتوان بدون تغییر آیپی به آن دسترسی داشت.
در فوریه 2016، High-Flyer توسط لیانگ ونفنگ، مشتاق هوش مصنوعی، که از زمان بحران مالی 2007 تا 2008 در دانشگاه ژجیانگ مشغول تجارت بود، تأسیس شد. تا سال 2019، او High-Flyer را به عنوان یک صندوق تامینی با تمرکز بر توسعه و استفاده از الگوریتمهای معاملاتی هوش مصنوعی تأسیس کرد. تا سال 2021، High-Flyer به طور انحصاری از هوش مصنوعی در تجارت استفاده میکرد، اغلب از تراشه های Nvidia استفاده میکرد. DeepSeek چت ربات هوش مصنوعی مولد خود را منبع باز کرده است، به این معنی که کد آن به صورت رایگان برای استفاده، اصلاح و مشاهده در دسترس است. این شامل اجازه دسترسی و استفاده از کد منبع، و همچنین اسناد طراحی، برای اهداف ساختمانی است.
در سال 2021، در حالی که High-Flyer را اجرا میکرد، لیانگ شروع به ذخیره سازی پردازنده های گرافیکی Nvidia برای یک پروژه هوش مصنوعی کرد. با توجه به 36Kr، لیانگ یک فروشگاه از 10000 پردازنده گرافیکی Nvidia A100 ایجاد کرده بود که برای آموزش هوش مصنوعی استفاده میشود، قبل از اینکه دولت فدرال ایالات متحده محدودیت های تراشه های هوش مصنوعی را در چین اعمال کند.
در آوریل 2023، High-Flyer یک آزمایشگاه هوش مصنوعی را راه اندازی کرد که به تحقیق در مورد توسعه ابزارهای هوش مصنوعی جدا از تجارت مالی High-Flyer اختصاص داشت. در می2023، با High-Flyer به عنوان یکی از سرمایه گذاران، آزمایشگاه به شرکت خود، DeepSeek تبدیل شد. شرکتهای سرمایهگذاری مخاطرهآمیز تمایلی به تأمین بودجه نداشتند، زیرا بعید بود که بتواند در مدت زمان کوتاهی خروجی ایجاد کند.
پس از انتشار DeepSeek-V2 در ماه مه 2024، که عملکرد قوی را با قیمت پایین ارائه میکرد، DeepSeek به عنوان کاتالیزور جنگ قیمت مدل هوش مصنوعی چین شناخته شد. به سرعت به آن "Pinduoduo of AI" لقب گرفت و دیگر غول های فناوری بزرگ مانند ByteDance، Tencent، Baidu و Alibaba شروع به کاهش قیمت مدل های هوش مصنوعی خود کردند تا با این شرکت رقابت کنند. علیرغم قیمت پایینی که توسط DeepSeek در نظر گرفته شده بود، در مقایسه با رقبای خود که پول خود را از دست میدادند سودآور بود.
DeepSeek بر تحقیق متمرکز است و هیچ برنامه دقیقی برای تجاری سازی ندارد؛این همچنین به فناوری آن اجازه میدهد تا از سختگیرانه ترین مقررات مقررات هوش مصنوعی چین، مانند الزام فناوری مواجهه با مصرف کننده برای انطباق با کنترل های دولت بر روی اطلاعات، اجتناب کند.
اولویتهای استخدامی DeepSeek به جای تجربه کاری، تواناییهای فنی را هدف قرار میدهد، در نتیجه بیشتر استخدامهای جدید فارغالتحصیلان دانشگاهی یا توسعهدهندگانی هستند که مشاغل هوش مصنوعی کمتری دارند. به همین ترتیب، این شرکت افرادی را بدون پیشزمینه علوم کامپیوتر استخدام میکند تا به فناوری خود کمک کند تا موضوعات و حوزههای دانش دیگر را درک کند، از جمله توانایی تولید شعر و عملکرد خوب در امتحانات پذیرش کالج چینی (Gaokao).
طبق گزارش36kr، لیانگ پیش از اعمال محدودیتهای دولت ایالات متحده برای تراشههای هوش مصنوعی در چین، حدود دههزار انویدیا A100 تهیه کرده بود. برخی برآوردها نشان میدهد ممکن است تعداد آن به 0 هزار هم برسد. در آوریل2023، های-فلایر یک آزمایشگاه هوش عمومی مصنوعی ایجاد کرد که روی پژوهش و توسعه ابزارهای هوش مصنوعی جدا از کسبوکار مالی های-فلایر متمرکز بود. در مه 2023، با همکاری یک سرمایهگذار جدید، یعنی های-فلایر، این آزمایشگاه به شرکتی مستقل تبدیل شد به نام دیپسیک. شرکتهای سرمایه گذاری خطر پذیر تمایل چندانی برای تأمین مالی از خود نشان نمیدادند، چرا که به نظر نمیرسید دیپسیک بتواند در زمان کوتاهی خروج سرمایه را مهیا کند.
پس از عرضه DeepSeek-V2 در مه 2024 که عملکرد قدرتمندی را با هزینه اندک ارائه میداد، دیپسیک بهعنوان عامل آغاز جنگ قیمتی در بازار مدلهای هوش مصنوعی چین شناخته شد. خیلی زود از آن با عنوان «پین دودوی هوش مصنوعی» یاد شد و سایر غولهای فناوری از جملهیابت دنس، تنسنت، بایدو و علی بابا بهمنظور رقابت با این شرکت، قیمت مدلهای هوش مصنوعی خود را کاهش دادند. باوجود هزینه اندکی که دیپسیک از مشتریان دریافت میکرد، همچنان سودآور بود، در حالی که رقبای آن زیانده بودند. دیپسیک صرفاً بر پژوهش متمرکز است و برنامه مشخصی برای تجاریسازی ندارد؛این موضوع همچنین به فناوری دیپسیک اجازه میدهد از سختگیرانهترین مقررات چین در زمینه هوش مصنوعی، مانند قوانین مربوط به کنترل محتوای ارائهشده به مصرفکنندگان، تا حدی معاف بماند.
دیپسیک ترجیح میدهد که استخدامها مواکداً بر توانمندی فنی باشد، نه صرفاً سابقه کاری. در نتیجه بیشتر استخدامها یا از دانشآموختگان جدید دانشگاهها هستند یا توسعهدهندگانی با سابقه کمتر در حوزه هوش مصنوعی. همچنین این شرکت افرادی را بدون پیشینه علمی در علوم رایانه جذب میکند تا توانایی فناوری آن در درک موضوعات و حوزههای دانشی دیگر افزایش یابد و بتواند مثلاً شعر بسراید یا در کنکور سخت دانشگاه های چین عملکرد خوبی نشان دهد.
در 2 نوامبر 2023، DeepSeek اولین سری مدل خود را با نام DeepSeek-Coder منتشر کرد که به صورت رایگان برای محققان و کاربران تجاری در دسترس است. کد مدل تحت مجوز MIT بهصورت متنباز ساخته شد، با یک قرارداد مجوز اضافی ("مجوز DeepSeek") در رابطه با "استفاده باز و مسئول پایین دست" برای خود مدل.
آنها از همان معماری DeepSeek LLM هستند که در زیر توضیح داده شده است. این سری شامل 8 مدل، 4 مدل از پیش آموزش دیده (Base) و 4 مدل آموزش دقیق (Instruct) است. همه آنها دارای طول زمینه 16K هستند. آموزش به شرح زیر بود:
آنها بر روی خوشههایی از پردازندههای گرافیکی Nvidia A100 و H800 آموزش دیدهاند که توسط InfiniBand، NVLink، NVSwitch وصل شدهاند.
در 29 نوامبر 2023، DeepSeek سری مدلهای DeepSeek-LLM را با پارامترهای 7B و 67B در هر دو فرم Base و Chat منتشر کرد (هیچ دستورالعملی منتشر نشد). این برای رقابت با سایر LLM های موجود در آن زمان توسعه داده شد. این مقاله ادعا کرد که نتایج معیار بالاتر از بسیاری از LLM های منبع باز در آن زمان، به ویژه Llama 2 است.
معماری اساساً همان معماری سری لاما بود. آنها از ترانسفورماتور فقط رمزگشای پیش-هنجار با RMSNorm به عنوان عادی سازی، SwiGLU در لایه های پیشخور، تعبیه موقعیتی چرخشی (RoPE) و توجه پرس و جوی گروهی (GQA) استفاده کردند. هر دو دارای حجم واژگان 102400 (BPE در سطح بایت) و طول متن 4096 بودند. آنها بر روی 2 تریلیون نشانه متن انگلیسی و چینی که با حذف کپی کردن Common Crawl به دست آمده بودند، آموزش دیدند.
نسخههای چت دو مدل پایه نیز به طور همزمان منتشر شد، که با آموزش Base توسط تنظیم دقیق نظارت شده (SFT) و به دنبال آن بهینهسازی سیاست مستقیم (DPO) به دست آمد.
در 9 ژانویه 2024، آنها 2 مدل DeepSeek-MoE (Base، Chat)، هر کدام از 16B پارامتر (2.7B فعال در هر توکن، طول زمینه 4K) منتشر کردند. این آموزش اساساً مشابه DeepSeek-LLM 7B بود و بر روی بخشی از مجموعه داده آموزشی آن آموزش داده شد. آنها ادعا کردند عملکرد قابل مقایسه با 16B MoE به عنوان 7B غیر MoE. در معماری، این گونهای از MOE استاندارد با دروازههای پراکنده است، با «متخصصان مشترک» که همیشه مورد پرسش قرار میگیرند، و «متخصصان مسیریابی» که ممکن است نباشند. آنها دریافتند که این به تعادل متخصص کمک میکند. در MOE استاندارد، میتوان به برخی از کارشناسان بیش از حد اعتماد کرد، در حالی که ممکن است کارشناسان دیگر به ندرت مورد استفاده قرار گیرند و پارامترها را هدر دهند. تلاش برای ایجاد تعادل بین متخصصان به گونه ای که از آنها به طور یکسان استفاده شود، باعث میشود کارشناسان همان ظرفیت را تکرار کنند. آنها کارشناسان مشترک را برای یادگیری ظرفیت های اصلی که اغلب استفاده میشود، پیشنهاد کردند، و به متخصصان مسیریابی اجازه دادند تا ظرفیت های جانبی را که به ندرت استفاده میشود، بیاموزند.
با DeepSeek-Coder-Base-v1.5 7B که قبلاً از قبل آموزش داده شده بود، راه اندازی کنید.
پیشآموزش بیشتر با 500 میلیارد توکن (6% DeepSeekMath Corpus، 4% AlgebraicStack، 10% arXiv، 20% کد GitHub، 10% Common Crawl). این مدل پایه را تولید کرد.
یک مدل پیروی از دستورالعمل توسط SFT Base با 776K مسائل ریاضی و راه حل های گام به گام یکپارچه با استفاده از ابزار آنها را آموزش دهید. این مدل Instruct را تولید کرد.
یادگیری تقویتی (RL): مدل پاداش یک مدل پاداش فرآیند (PRM) بود که از Base طبق روش Math-Shepherd آموزش داده شد.[31] سپس این مدل پاداش برای آموزش Instruct با استفاده از بهینهسازی خط مشی نسبی گروهی (GRPO) روی مجموعه دادهای از 144 هزار سؤال ریاضی «مربوط به GSM8K و MATH» استفاده شد. مدل پاداش به طور مداوم در طول آموزش به روز میشد تا از هک پاداش جلوگیری شود. این منجر به مدل RL شد.
پیش آموزش روی مجموعه داده ای از توکن های 8.1T، که در آن توکن های چینی 12 درصد بیشتر از نمونه های انگلیسی هستند. با استفاده از YaRN، طول زمینه را از 4K به 128K افزایش دهید. این منجر به DeepSeek-V2 شد. SFT با 1.2M نمونه برای مفید بودن و 0.3M برای ایمنی. این منجر به DeepSeek-V2-Chat (SFT) شد که منتشر نشد. RL با استفاده از GRPO در دو مرحله. مرحله اول برای حل مسائل ریاضی و کدگذاری آموزش داده شد. در این مرحله از 1 مدل پاداش، آموزش داده شده بر روی بازخورد کامپایلر (برای کدنویسی) و برچسبهای حقیقت پایه (برای ریاضی) استفاده شد. مرحله دوم برای مفید بودن، ایمن بودن و پیروی از قوانین آموزش داده شد. در این مرحله از 3 مدل پاداش استفاده شد. مدلهای پاداش مفید و ایمنی بر روی دادههای ترجیحات انسانی آموزش داده شدند. مدل پاداش مبتنی بر قانون به صورت دستی برنامه ریزی شد. همه مدل های پاداش آموزش دیده از DeepSeek-V2-Chat (SFT) مقداردهی اولیه شدند. این منجر به نسخه منتشر شده DeepSeek-V2-Chat شد. آنها RL 2 مرحله ای را انتخاب کردند، زیرا دریافتند که RL در داده های استدلالی دارای "ویژگی های منحصر به فرد" متفاوت از RL در داده های عمومی است. به عنوان مثال، RL در استدلال میتواند بیش از مراحل آموزشی بیشتر بهبود یابد.
دو مدل V2-Lite کوچکتر بودند و به طور مشابه آموزش دیدند، اگرچه DeepSeek-V2-Lite-Chat فقط تحت SFT قرار گرفت، نه RL. آنها نسخه Lite را برای کمک به "تحقیق و توسعه بیشتر در مورد MLA و DeepSeekMoE" آموزش دادند. از نظر معماری، مدل های V2 به طور قابل توجهی از سری DeepSeek LLM اصلاح شدند. آنها مکانیسم توجه استاندارد را با یک تقریب رتبه پایین به نام توجه نهفته چند سر (MLA) تغییر دادند و از ترکیبی از متخصصان (MoE) که قبلاً در ژانویه منتشر شده بود استفاده کردند.
فایننشال تایمز گزارش داد که ارزان تر از همتایان خود با قیمت 2 RMB برای هر میلیون توکن خروجی است. تابلوی امتیازات آزمایشگاه ببر دانشگاه واترلو، DeepSeek-V2 را در رتبه هفتم رتبه بندی LLM خود قرار داد.
مدلهای پایه پس از پیشآموزش روی توکنهای 4.2T (نه نسخهای در پایان پیشآموزش) از نقاط بازرسی میانی مربوطه اولیهسازی شدند، سپس برای توکنهای 6T پیشآموزش داده شدند، سپس به طول زمینه 128K گسترش یافتند. این مدل های پایه را تولید کرد.
DeepSeek-Coder و DeepSeek-Math برای تولید 20K داده دستورالعمل مرتبط با کد و 30K داده های دستورات ریاضی مورد استفاده قرار گرفتند، سپس با مجموعه داده دستورالعملی از 300 میلیون توکن ترکیب شدند. این برای SFT استفاده شد. RL با GRPO. پاداش برای مسائل ریاضی با مقایسه با برچسب حقیقت پایه محاسبه شد. پاداش برای مشکلات کد توسط یک مدل پاداش ایجاد شد که برای پیشبینی اینکه آیا یک برنامه آزمونهای واحد را پشت سر میگذارد آموزش دیده بود. DeepSeek-V2.5 در سپتامبر منتشر شد و در دسامبر 2024 به روز شد. با ترکیب DeepSeek-V2-Chat و DeepSeek-Coder-V2-Instruct ساخته شد.
- «مدلهای خبره» با شروع با یک مدل پایه نامشخص، سپس SFT بر روی دادههای <مشکل، پاسخ اصلی> و دادههای مصنوعی <سیستم اعلان، مشکل، پاسخ R1> که توسط یک مدل داخلی DeepSeek-R1 تولید میشوند، آموزش داده شدند. اعلان سیستم از R1 خواست تا در حین تفکر بازتاب و تأیید کند. سپس مدل های خبره با استفاده از یک تابع پاداش نامشخص RL بودند.
- هر مدل متخصص برای تولید دادههای استدلال مصنوعی در یک حوزه خاص (ریاضی، برنامهنویسی، منطق) آموزش داده شد.
- از مدل های خبره به جای خود R1 استفاده شد، زیرا خروجی خود R1 دچار "تفکر بیش از حد، قالب بندی ضعیف و طول بیش از حد" بود.
مدلهای پاداش مبتنی بر مدل با شروع با یک نقطه بازرسی SFT از V3، سپس تنظیم دقیق دادههای ترجیحی انسانی که شامل پاداش نهایی و زنجیرهای از فکر است که منجر به پاداش نهایی میشود، ساخته شدند. مدل پاداش برای هر دو سؤال با پاسخ های عینی اما آزاد و سؤالات بدون پاسخ عینی (مانند نوشتن خلاقانه) سیگنال های پاداش تولید میکند. یک ایست بازرسی SFT از V3 توسط GRPO با استفاده از هر دو مدل پاداش و پاداش مبتنی بر قانون آموزش داده شد. پاداش مبتنی بر قانون برای مسائل ریاضی با پاسخ نهایی (در یک جعبه قرار داده شده) و برای مسائل برنامه نویسی با آزمون های واحد محاسبه شد. این DeepSeek-V3 را تولید کرد.
در 20 نوامبر 2024، DeepSeek-R1-Lite-Preview از طریق API DeepSeek و همچنین از طریق رابط چت پس از ورود به سیستم در دسترس قرار گرفت. حل مسئله در زمان واقعی DeepSeek ادعا کرد که از عملکرد OpenAI o1 در معیارهایی مانند آزمون ریاضی دعوتی آمریکا (AIME) و MATH فراتر رفته است. با این حال، وال استریت ژورنال بیان کرد که وقتی از 15 مسئله از نسخه 2024 AIME استفاده کرد، مدل o1 سریعتر از DeepSeek-R1-Lite-Preview به راه حل رسید. در 20 ژانویه 2025، DeepSeek DeepSeek-R1 و DeepSeek-R1-Zero را منتشر کرد. هر دو از DeepSeek-V3-Base مقداردهی اولیه شده اند و معماری آن را به اشتراک میگذارند. این شرکت همچنین برخی از مدلهای «DeepSeek-R1-Distill» را منتشر کرد که در V3-Base مقداردهی اولیه نشدهاند، اما در عوض از دیگر مدلهای وزن باز از پیش آموزشدیده، از جمله LLaMA و Qwen اولیهسازی شدهاند، سپس بر روی دادههای مصنوعی تولید شده توسط R1 تنظیم شدهاند.
DeepSeek-R1-Zero منحصراً با استفاده از GRPO RL بدون SFT آموزش داده شد. برخلاف نسخههای قبلی، آنها از پاداش مبتنی بر مدل استفاده نمیکردند. همه توابع پاداش مبتنی بر قانون بودند، "عمدتا" از دو نوع (انواع دیگر مشخص نشد): پاداش دقت و پاداش قالب. پاداش دقت بررسی این بود که آیا یک پاسخ جعبه ای درست است (برای ریاضی) یا اینکه آیا یک کد در آزمون ها (برای برنامه نویسی) موفق است یا خیر. پاداش قالب بررسی این بود که آیا مدل ردپای تفکر خود را در <think>...</think> قرار میدهد یا خیر.
مدلهای مقطر توسط SFT بر روی دادههای 800K سنتز شده از DeepSeek-R1، به روشی مشابه مرحله 3 بالا، آموزش داده شدند. آنها با RL آموزش ندیده بودند.
DeepSeek دستیار هوش مصنوعی خود را منتشر کرد که از مدل V3 به عنوان یک برنامه چت بات برای Apple IOS و Android استفاده میکند. تا 27 ژانویه 2025، این برنامه از ChatGPT پیشی گرفت و بالاترین امتیاز را در اپ استور iOS در ایالات متحده داشت. ربات چت آن بر اساس تستهای معیاری که شرکتهای هوش مصنوعی آمریکایی استفاده میکنند، ظاهراً به سؤالات پاسخ میدهد، مشکلات منطقی را حل میکند، و برنامههای رایانهای را همتراز با دیگر چتباتهای موجود در بازار مینویسد.
DeepSeek-V3 در مقایسه با همتایان خود از منابع بسیار کمتری استفاده میکند. برای مثال، در حالی که شرکتهای پیشرو هوش مصنوعی جهان چتباتهای خود را با ابررایانهها با استفاده از 16000 واحد پردازش گرافیکی (GPU) آموزش میدهند، اما DeepSeek ادعا میکند که تنها به حدود 2000 پردازنده گرافیکی، یعنی چیپ سری H800 از Nvidia نیاز داشته است. این در حدود 55 روز با هزینه 5.58 میلیون دلار آمریکا آموزش داده شد، که تقریباً یک دهم هزینه ای است که غول فناوری ایالات متحده متا برای ساخت آخرین فناوری هوش مصنوعی خود هزینه کرده است. DeepSeek-V3 در مقایسه با همتایان خود از منابع بسیار کمتری استفاده میکند. برای مثال، در حالی که شرکتهای پیشرو هوش مصنوعی جهان چتباتهای خود را با ابررایانهها با استفاده از 16000 واحد پردازش گرافیکی (GPU) آموزش میدهند، اما DeepSeek ادعا میکند که تنها به حدود 2000 پردازنده گرافیکی، یعنی چیپ سری H800 از Nvidia نیاز داشته است. این در حدود 55 روز با هزینه 5.58 میلیون دلار آمریکا آموزش داده شد، [38] که تقریباً یک دهم هزینه ای است که غول فناوری ایالات متحده متا برای ساخت آخرین فناوری هوش مصنوعی خود هزینه کرده است. عملکرد رقابتی DeepSeek با هزینه نسبتاً حداقل به عنوان به طور بالقوه به چالش کشیدن سلطه جهانی مدل های هوش مصنوعی آمریکایی شناخته شده است.نشریات و رسانه های خبری مختلف، مانند The Hill و The Guardian، انتشار ربات چت آن را به عنوان "لحظه اسپوتنیک" برای هوش مصنوعی آمریکایی توصیف کردند.عملکرد مدل R1 آن در زمانی که برای کارهایی مانند ریاضیات، کدنویسی و استدلال زبان طبیعی استفاده میشود، طبق گزارش «همتراز» با یکی از جدیدترین مدلهای OpenAI بود؛ با تکرار دیگر مفسران، مارک آندریسن، سرمایهدار آمریکایی سیلیکون ولی، R1 را نیز توصیف کرد. به عنوان "لحظه اسپوتنیک هوش مصنوعی". بنیانگذار DeepSeek، لیانگ ونفنگ، با سام آلتمن، مدیر عامل هوش مصنوعی Open مقایسه شده است، و CNN او را سم آلتمن چین و بشارت دهنده هوش مصنوعی مینامد. رسانه های دولتی چین به طور گسترده ای DeepSeek را به عنوان یک دارایی ملی ستایش کردند در 20 ژانویه 2025، لی کیانگ، نخست وزیر چین، لیانگ ونفنگ را به سمپوزیوم خود با کارشناسان دعوت کرد و از او خواست تا نظرات و پیشنهاداتی را در مورد پیش نویسی برای نظرات گزارش کار سالانه دولت 2024 ارائه کند. بهینهسازی منابع محدود توسط DeepSeek محدودیتهای بالقوه تحریمهای ایالات متحده بر توسعه هوش مصنوعی چین را برجسته کرده است که شامل محدودیتهای صادراتی تراشههای هوش مصنوعی پیشرفته به چین میشود. در نتیجه موفقیت مدلهای هوش مصنوعی این شرکت باعث آشفتگی در بازار شد و باعث شد که سهام شرکتهای بزرگ فناوری جهانی در 27 ژانویه 2025 سقوط کند: سهام انویدیا به اندازه 17 تا 18 درصد کاهش یافت. رقیب Broadcom سایر شرکت های فناوری نیز غرق شدند، از جمله مایکروسافت (افت 2.5 درصدی)، مالک آلفابت گوگل (کاهش بیش از 4 درصد)، و سازنده تجهیزات تراشه هلندی ASML (کاهش بیش از 7 درصد). فروش جهانی سهام فناوری نزدک، به دلیل انتشار مدل R1، منجر به زیان بی سابقه ای در حدود 593 میلیارد دلار در ارزش بازار شرکت های هوش مصنوعی و سخت افزار رایانه شده بود؛ تا 28 ژانویه 2025، در مجموع 1 دلار. تریلیون ها ارزش از سهام آمریکا پاک شد. چهرههای پیشرو در بخش هوش مصنوعی آمریکا واکنشهای متفاوتی به موفقیت و عملکرد DeepSeek داشتند. ساتیا نادلا، مدیر عامل مایکروسافت و سام آلتمن، مدیر عامل OpenAI - که شرکتهایشان در پروژه "Stargate Project" تحت حمایت دولت ایالات متحده برای توسعه زیرساختهای هوش مصنوعی آمریکایی مشارکت دارند - هر دو DeepSeek را "فوق العاده چشمگیر" نامیدند. دونالد ترامپ، رئیس جمهور آمریکا، که پروژه دروازه ستاره ای را اعلام کرد، DeepSeek را یک زنگ بیدارباش و یک پیشرفت مثبت نامید. رهبران دیگر در این زمینه، از جمله الکساندر وانگ، مدیرعامل Scale AI، داریو آمودی، بنیانگذار و مدیر عامل Anthropic، و ایلان ماسک نسبت به عملکرد برنامه یا پایداری موفقیت آن ابراز تردید کردند. شرکت های مختلفی از جمله خدمات وب آمازون، تویوتا و استرایپ به دنبال استفاده از این مدل در برنامه خود هستند. در 27 ژانویه 2025، DeepSeek ثبت نام کاربر جدید خود را به شماره تلفن های سرزمین اصلی چین، آدرس های ایمیل، یا ورود به حساب های Google محدود کرد، به دنبال یک حمله سایبری "در مقیاس وسیع" که عملکرد صحیح سرورهایش را مختل کرد.
مدل DeepSeek V3 یکی از پیشرفتهترین مدلهای هوش مصنوعی استارتاپ چینی دیپسیک است که در تاریخ 26 دسامبر 2024 (6 دی) معرفی شد. دیپسیک هوش مصنوعی جدید خود را بر پایهی معماری Mixture of Experts (MoE) طراحی کرد. در این معماری، مدل کلی هوش مصنوعی از چندین «متخصص» (زیرمدل) تشکیل شده است که تنها تعداد محدودی از آنها در هر درخواست بنا به نیاز فعال میشوند. این طراحی هوشمندانه مصرف منابع را کاهش داده و کارایی مدل را افزایش میدهد.
DeepSeek V3 با 671 میلیارد پارامتر طراحی شده است؛ اما در هر درخواست تنها 37 میلیارد پارامتر فعال میشوند. deep seek هوش مصنوعی V3 را تنها در مدت 2 ماه (نزدیک به 2.8 میلیون ساعت GPU) با 2048 پردازندهی انویدیا H800 و با هزینهای معادل 5.58 میلیون دلار آموزش داد. برای مقایسه، متا برای آموزش LLaMA 3 با 405 میلیارد پارامتر، ۱۱ برابر منابع بیشتر (30.8 میلیون ساعت GPU) مصرف کرد.
DeepSeek V3 در حوزههای متنوعی مانند پردازش زبان طبیعی (NLP)، ریاضیات و برنامهنویسی عملکرد چشمگیری دارد. در آزمون استانداردی مانند MMLU (دانش چندزمینهای)، این مدل کارایی ۸۸٫۵ درصدی را کسب کرد. در آزمونهای استاندارد مانند Math-500، این مدل با دقت 90.2 درصد از GPT-4o (با74.6 درصد) پیشی گرفته و در تحلیل فایلهای PDF و ارائهی پاسخهای شخصیسازیشده نیز عملکرد برجستهای از خود نشان داد. در مقابل، مدلهای پیشرفتهای مانند GPT-4o یا Claude 3.5 Sonnet در زمینهی خلاقیت و تولید ایده، بهویژه در حوزههای تحقیقاتی پیچیده، همچنان نسبتبه DeepSeek V3 برتری دارند.
اوج موفقیت دیپسیک، با معرفی مدل DeepSeek-R1 در تاریخ 20 ژانویه (یک بهمن) رقم خورد. این مدل بر پایهی DeepSeek V3 و با استفاده از ترکیبی از یادگیری تقویتی (Reinforcement Learning) و تنظیم دقیق نظارتشده (SFT) آموزش دیده است. این رویکرد، توانایی استدلال منطقی و زنجیرهای را در این مدل تقویت کرده و آن را برای حل مسائل پیچیده و کاربردهای استدلالمحور به گزینهای ایدهآل تبدیل میکند.
مانند DeepSeek V3، مدل R1 نیز از معماری MoE بهره میبرد و تنها 37 میلیارد پارامتر آن در هر درخواست فعال میشود. این طراحی هوشمندانه با کاهش هزینهها تا 90 درصد، به DeepSeek-R1 اجازه میدهد تنها با کسری از هزینه، در مواردی مانند ریاضیات، کدنویسی و استدلال با مدل پیشرفتهای مانند o1 از OpenAI رقابت کند و در برخی موارد از آن پیشی بگیرد.
DeepSeek-R1 در حوزهی ریاضیات پیشرفته در آزمون AIME 2024 امتیاز 79.8درصد (بالاتر از 79.2 درصدی مدل o1 از OpenAI) و در آزمون MATH-500 امتیاز 97.3 درصد را کسب کرد. R1 در بحث برنامهنویسی، با کسب امتیاز 2028 در آزمون Codeforces، نسبت به 96.3 درصد از برنامه نویسان انسانی عملکرد بهتری از خود نشان داد. در نهایت، مدل پیشرفتهی R1 توانست با به دست آوردن دقت 92.2 درصد در drop (3-shot F1) و 90.8 درصد در MMLU، عملکردی نزدیک به مدل o1 (با امتیاز 92.3 درصد) داشته باشد. مدلo1 از OpenAI برای هر میلیون توکن ورودی15 دلار و برای هر میلیون توکن خروجی 60 دلار هزینه دارد؛ این مقادیر برای DeepSeek-R1 برای هر میلیون توکن ورودی 0.55 دلار و برای خروجی 2.19 دلار هستند؛ یعنی27 برابر ارزانتر. مدلهای DeepSeek V3 و R1 از دیپسیک برای دانلود و اجرای لوکال از طریق گیتهاب و Hugging Face در دسترس علاقهمندان قرار دارند. این مدلها با مجوز MIT منتشر شدهاند و استفادهی تجاری و تغییرات آزادانه در آنها امکانپذیر است. بااینحال، منابع بسیار زیادی که نصب دیپ سیک و اجرای آن بهطور لوکال طلب میکند، بسیاری را به نسخهی وب هوش مصنوعی چینی ها سوق میدهد.
همانطور که پیشتر اشاره شد، میتوان بدون نیاز به ابزارهای تغییر آیپی و تنها با ثبتنام از طریق ایمیل، بهصورت رایگان به هوش مصنوعی دیپسیک دسترسی داشت و از آن استفاده کرد.
1- برای ثبتنام در سایت deep seek ابتدا صفحهی لاگین را از طریق لینک زیر باز کنید:
2- اگر حساب گوگل دارید، میتوانید گزینهی Log in with Google را انتخاب کنید و با استفاده از حساب گوگل خود ثبتنام را تکمیل کنید و وارد حساب دیپسیک خود شوید.
3- اگر ترجیح میدهید برای ثبتنام در سایت دیپسیک از ایمیل دیگری استفاده کنید:
هوش مصنوعی آنلاین دیپ سیک با رابط کاربری ساده و روان طراحی شده است. برای استفاده، باید دستور یا سؤال خود را در کادر متنی وسط صفحه وارد کنید و با زدن کلید Enter یا کلیک روی آیکون فلش ارسال، منتظر پاسخ دیپسیک باشید.
برای دریافت پاسخهایی که بر اساس اطلاعات بهروز اینترنت ارائه میشوند، ابتدا قابلیت جستجوی وب را با کلیک روی دکمهی Search فعال کنید. سپس سؤال خود را وارد و ارسال کنید. دیپ سیک اینترنت را جستوجو میکند و تعداد منابعی را که برای پاسخدهی استفاده کرده است، در بالای کادر پاسخ به شما نشان میدهد.
میتوانید با کلیک روی این بخش، لیست وبسایتهایی که دیپ سیک به آنها رجوع کرده، مشاهده کنید. همچنین، در محتوای پاسخ، شماره منابع مرتبط به هر بخش ذکر شده است تا در صورت نیاز به منبع اصلی مراجعه کنید.
قابلیت DeepThink R1 در دیپ سیک یکی از ویژگیهای خاص است که برای حل مسائل پیچیده مانند تحلیلهای فنی یا مسائل ریاضی پیشرفته کاربرد دارد. با فعال کردن این حالت از پایین سمت چپ کادر دستور، هنگام سؤال از هوش مصنوعی، دیپ سیک پرسش شما را به بخشهای کوچکتر تقسیم میکند و پاسخی دقیقتر و تفکیکشده ارائه میدهد.
در حالت یادشده، فرایند پاسخدهی کمی طولانیتر است (بین ۱۰ تا ۲۰ ثانیه)؛ اما کیفیت پاسخها بهطور محسوسی افزایش مییابد. همچنین، کاربران میتوانند روند تفکر و تحلیل درونی دیپ سیک را حین پردازش مشاهده کنند.
برای آپلود فایل در دیپ سیک، باید روی آیکون گیرهی کاغذ در پایین سمت راست کادر دستور کلیک کنید. این قابلیت از فرمتهای مختلف (PDF, DOCX, PPT, TXT, XLSX) و تصاویر پشتیبانی میکند. هر فایل میتواند حداکثر ۱۰۰ مگابایت حجم داشته باشد، و امکان آپلود همزمان تا ۵۰ فایل وجود دارد. بااینحال، دیپ سیک تنها قادر به استخراج و تحلیل متن موجود در این فایلها است.
پس از آپلود فایل، میتوانید در کادر متنی دستور خود را وارد کنید؛ برای مثال، درخواست خلاصهسازی یک مقاله یا پاسخ به سؤال دربارهی محتوای فایل. سپس دستور را ارسال کنید تا دیپ سیک، درخواست شما را بر اساس متن فایل اجرا کند.
در پایین سمت راست هر پاسخ دیپسیک، گزینههایی مانند: کپی کردن پاسخ، ایجاد دوباره پاسخ (Regenerate)، لایک و دیسلایک وجود دارد تا بتوانید با محتوا تعامل کنید.
همچنین، اگر نشانگر ماوس را روی دستورات ارسالی خود قرار دهید، گزینههای ویرایش دستور و کپی دستور در سمت راست کادر ظاهر میشوند.
پس از هر بار تغییر دستور یا ایجاد دوبارهی پاسخ هنگام سؤال از هوش مصنوعی، فلشهایی در زیر دستور یا پاسخ ظاهر میشوند که به شما امکان جابهجایی بین نسخههای مختلف دستورات و پاسخها را میدهند.
تمام مکالمات شما در بخش منوی کناری سمت چپ ذخیره میشوند. با کلیک روی سهنقطه افقی کنار هر مکالمه میتوانید نام آن را تغییر دهید یا مکالمه را حذف کنید.
برای دسترسی به تنظیمات و گزینههای دیگر، روی قسمت My Profile در منوی کناری کلیک کنید.
در این بخش با کلیک روی Settings و مراجعه به تب General، میتوانید تم دیپ سیک را بین حالت روشن و تاریک تغییر دهید یا زبان رابط کاربری را تنظیم کنید (درحالحاضر فقط زبانهای چینی و انگلیسی موجود است).
در تب Profile، امکان حذف کامل حساب کاربری وجود دارد؛ علاوهبراین، میتوانید از گزینه Log out برای خروج از حساب فعلی استفاده کنید یا با یک کلیک تمامی مکالمات خود را پاک کنید.
برای استفاده از هوش مصنوعی دیپ سیک در موبایل ابتدا باید نسخهی مناسب گوشی خود را از طریق صفحهی دانلود برنامه دیپ سیک در گوگلپلی یا اپاستور اپل دانلود کنید.
فرآیند ثبتنام در نرم افزار deepseek موبایل کاملاً شبیه ثبتنام در نسخهی وب آن است. پس از دانلود هوش مصنوعی deepseek و باز کردن اپ، میتوانید با گزینهی Sign Up وارد صفحهی ثبتنام شوید و پس از تکمیل آن با ایمیل و پسورد خود به اپلیکیشن deepseek وارد شوید. امکان ورود با اکانت گوگل نیز فراهم است.
رابط کاربری اپلیکیشن deepseek شباهت بسیاری به نسخهی وب آن دارد. پس از ورود به اپلیکیشن کادر ورود درخواست را همراه با گزینههایی برای فعال کردن قابلیتهای جستوجوی وب و DeepThink میبینید. آیکون باز کردن چت جدید در گوشهی بالا سمت راست رابط کاربری دیده میشود.
با کلیک کردن آیکون + (کادر بنفش) میتوانید به گزینههای پیوست تصویر و سند به دستور، دسترسی پیدا کنید. برای انتخاب تصویر از گالری گزینهی Image OCR برای گرفتن تصویر با دوربین Photo OCR و برای انتخاب سند از فایل منیجر گوشی گزینهی Document را بزنید.
هنگامی که درون یک چت اپلیکیشن deepseek هستید، با ضربه زدن و نگهداشتن روی دستور فرستاده شده به گزینههای کپی، انتخاب متن و ویرایش دستور دسترسی پیدا میکنید. با ضربه زدن و نگه داشتن روی پاسخ دیپسیک، گزینههای کپی، انتخاب متن، بازتولید پاسخ، لایک و دیسلایک پاسخ و گزارش آن بهنمایش در میآید.
با ضربه روی آیکون مشخصشده گوشهی بالا سمت چپ منوی جانبی تاریخچهی چتها بهنمایش در میآید. برای باز کردن هر چت روی آن ضربه بزنید. با ضربه و نگه داشتن میتوانید هر چت را حذف یا نامش را تغییر دهید.
در منوی تاریخچهی چتهای اپلیکیشن دیپ سیک روی نام پروفایل خود ضربه بزنید. پساز باز شدن منوی تنظیمات میتوانید تم اپلیکیشن و زبان را تغییر دهید. چتهای خود را پاک یا بهطور کلی حسابتان را حذف کنید. خروج از اکانت نیز با گزینهی Log out انجام میشود.
برای اینکه بفمیم دیپسیک میتواند جایگزین چت جی پی تی باشد، بهطور سطحی عملکرد مدل DeepSeek V3 از استارتاپ چینی را با عملکرد مدل GPT-4o از OpenAI در پاسخ به دستورات به زبان فارسی را بررسی کردیم. در چند مورد پاسخهای دیپسیک با فعال بودن قابلیت DeepThink (که از مدل پیشرفتهی R1 استفاده میکند) نیز ارائه شده است.
ChatGPT توسط OpenAI توسعه یافته و به علت انعطافپذیری و مهارتهای مکالمه قوی خود از محبوبیت زیادی برخوردار است، اما هوش مصنوعی به پیشرفت خود ادامه داده و مدلهای جدیدتری مانند DeepSeek در حالت ارتقا سطح هستند. توجه داشته باشید DeepSeek دارای ویژگیهای منحصر به فردی بوده که باعث شده بتوان آن را انتخاب بهتری برای بسیاری از کارها معرفی کرد. در این بخش به 5 دلیل برتری DeepSeek در مقایسه با ChatGPT اشاره خواهیم کرد.
یکی از دلایل برتری DeepSeek را باید سرعت بالای پاسخدهی آن در مقایسه با ChatGPT دانست. شما در پاسخدهی ChatGPT شاهد چند ثانیه مکث خواهید بود، اما پاسخ DeepSeek در همان لحظه اتفاق خواهد افتاد. این سرعت برای کارهایی که نیازمند پاسخدهی لحظهای هستند، میتواند استثنایی باشد که در میان آنها میتوان به پشتیبانی از مشتریها و تحلیلهای مالی اشاره کرد.
به عنوان مثال، پزشکان میتوانند از DeepSeek در مراقبتهای بهداشتی با هدف تجزیه و تحلیل سریع دادههای بیمار و ارائه پیشنهادهای درمانی استفاده کنند. سرعت DeepSeek باعث صرفهجویی در زمان میشود، آن هم درست در شرایط اضطراری که میتواند ارزش بالای خود را نشان دهد.
در مقایسه DeepSeek با ChatGPT باید گفت سرعت مهمترین عامل برتری به حساب میآید. از طرف دیگر طراحی هوشمند و الگوریتمهای کارآمد DeepSeek به آن کمک میکند تا بتواند وظایف را بدون کاهش سرعت به سرانجام برساند.
شما باید بدانید DeepSeek میتواند درک مکالمه بهتری داشته باشد. جزئیات پیامهای قبل را به خاطر آورده و این در حالی است که گاهی وقتها ChatGPT اطلاعات را از دست داده یا در پاسخ به سوالهای بعد، دچار مشکل میشود. به عنوان مثال، حقوقدانها هنگام تحقیق نیازمند پاسخهای دقیق هستند.
هوش مصنوعی DeepSeek میتواند پروندههای حقوقی مرتبط با یکدیگر را متصل کرده و پیرامون آنها، پاسخهای دقیق را ارائه کند. آموزش باکیفیت بالای DeepSeek به آن کمک کرده تا بتواند نتایج قابل اعتمادی در زمینههایی مانند تحقیقهای حقوقی و پشتیبانی فنی ارائه کند.
هوش مصنوعی DeepSeek میتواند عملکرد بسیار خوبی از خود در بسیاری از صنایع نشان دهد. این هوش مصنوعی دارای ویژگیهایی ویژه برای بخشهایی مانند مراقبتهای بهداشتی، مالی و آموزش و پرورش است. کسب و کارها میتوانند به سادگی از آن برای پیشبرد اهداف خود استفاده کنند.
به عنوان مثال، DeepSeek میتواند برای ایجاد طرحهای سفارشی درسی برای دانشآموزان، گزینهای ایدهآل به حساب آید. بانکها میتوانند از این هوش مصنوعی برای کشف تخلفهای مالی در زمان واقعی استفاده کنند. هوش مصنوعی ChatGPT برای انجام کارهای ذکرشده نیازمند پلاگین یا کدنویسی اضافی بوده و این در حالی است که DeepSeek میتواند درک بهتری نسبت به وضعیت صنایع داشته باشد.
استفاده از هوش مصنوعی DeepSeek میتواند کار سادهای برای کاربران به حساب آید. طراحی ساده با اعلانهای هوشمند این هوش مصنوعی، توانسته باعث جلب توجه کاربران شود. البته باید گفت چت جی پی تی هم عملکرد خوبی دارد، اما معمولا نیازمند دستورالعملهای خاص بوده تا بتواند بهترین پاسخها را ارائه کند.
به عنوان مثال، یک بازاریاب میتواند از DeepSeek طرحی پیرامون یک رسانه اجتماعی را درخواست کند و خواهد دید که این هوش مصنوعی در سریعترین زمان، یک استراتژی دقیق با هشتگها و ایدههای پست را ارائه میکند. ChatGPT ممکن است برای اصلاح خروجی خود نیازمند پیگیریهای بیشتری باشد. رابط کاربری ساده DeepSeek به راحتی برای افراد بدون دانش فنی میتواند ایدهآل باشد.
DeepSeek هزینه کمتری در مقایسه با ChatGPT دارد. قیمت آن بر اساس استفاده تنظیم شده و همین مسئله توانسته آن را برای شغلهای کوچک و بزرگ، مقرون به صرفهتر کند. در مقابل شاهد قیمتهای بالایی از سوی ChatGPT هستیم.
یکی دیگر از نکات مهم که باید مدنظر قرار دهید، این است که DeepSeek از قدرت محاسباتی کمتری استفاده میکند و این مسئله در کاهش هزینهها تاثیر دارد. کسب و کارهای کوچک میتوانند DeepSeek را روی سرورهای اصلی اجرا کرده و وضعیت در چت جی پی تی نیازمند هزینههای نسبتا بالایی است؛ این انعطافپذیری تضمین میکند که DeepSeek میتواند گزینهای مقرون به صرفه و متناسب با بودجه کاربران باشد.
ابزارهای هوش مصنوعی میتوانند روش کار، یادگیری و حل مشکلات را تغییر دهند. ChatGPT تاثیر زیادی گذاشت، اما DeepSeek همه چیز را ارتقا داد. سرعت بالای پاسخگویی DeepSeek در مقایسه با رقیب خود به همراه درک بهتر و سازگاری بالا با صنایع در کنار طراحی ساده و مقرون به صرفه بودن، باعث شده بتوان گفت DeepSeek به مراتب از ChatGPT میتواند کاربردیتر باشد. اینطور که پیداست، DeepSeek و ابزارهای مشابه مسیر پیشرفت و حرکت به سمت جلو را نشان میدهند و به نظر میرسد در آینده نه چندان دور شاهد مدلهای جدید از هوش مصنوعی با کارایی بالاتر خواهیم بود.
اگر قصد استفاده از دیپ سیک را دارید و میخواهید آن را جایگرین چت باتهای نامی کنید، بهتر است ابتدا نگاهی به مزایا و معایب دیپ سیک و در ادامه مقایسه آن با چت جی پی تی داشته باشید.
نکتهی مهم در استفاده از نسخههای وب و موبایلی چتبات دیپ سیک، خطرهای احتمالی حریم خصوصی مرتبط با آن است. بر اساس سیاست حفظ حریم خصوصی دیپ سیک، این پلتفرم حق استفاده از ورودیها و خروجیهای کاربران را برای بهبود خدمات خود محفوظ میداند و هیچ مکانیزم روشنی برای انصراف از این فرایند وجود ندارد. همچنین دادههای کاربران در سرورهایی در چین ذخیره میشوند، جایی که قوانین حفاظت از دادهها متفاوت با کشورهای غربی است. خطرات یادشده محدود به دیپ سیک نیستند؛ بسیاری از چتباتهای هوش مصنوعی، مانند OpenAI و متا، دادههای کاربران را برای آموزش مدلهای خود استفاده میکنند، مگر اینکه کاربر صریحاً درخواست انصراف کند. بهتر است کاربران از اشتراکگذاری اطلاعات حساس با تمامی چتباتهای هوش مصنوعی آنلاین، خودداری و در صورت امکان، مدلهای متنباز (از جمله مدلهای دیپسیک) را روی سیستمهای شخصی اجرا کنند.
بستن *نام و نام خانوادگی * پست الکترونیک * متن پیام |
021-55529569 مشاوره رایگان محصولات
بستن ![]()
نام کاربری (ایمیل شما)
رمز عبور
نام کاربری (ایمیل شما)
کد امنیتی :
ورود
![]()
ارسال
![]() می خواهید ثبت نام کنید ؟ عضویت |