menuordersearch
digitiran.com

هوش مصنوعی رایگان DeepSeek ,

۱۴۰۳/۱۱/۱۳ شنبه
(0)
(0)
هوش مصنوعی رایگان DeepSeek
هوش مصنوعی رایگان  DeepSeek

هوش مصنوعی دیپ سیک DeepSeek چیست ؟

Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd که معمولاً به عنوان DeepSeek شناخته می‌شود (به چینی: 深度求索؛ پینیین: Shēndù Qiúsuǒ) یک شرکت هوش مصنوعی چینی است که مدل های زبان بزرگ منبع باز (LLM) را توسعه می‌دهد. مستقر در هانگژو، ژجیانگ، متعلق به صندوق تامینی چینی High-Flyer است که یکی از بنیانگذاران آن، لیانگ ونفنگ، شرکت را در سال 2023 تاسیس کرد و به عنوان مدیر عامل آن فعالیت می‌کند.

مدل DeepSeek-R1 پاسخ هایی را ارائه می‌دهد که با سایر مدل های زبان بزرگ معاصر مانند GPT-4o و o1 OpenAI قابل مقایسه است. این آموزش با هزینه بسیار کمتری انجام می‌شود - 6 میلیون دلار آمریکا در مقایسه با 100 میلیون دلار برای GPT-4 OpenAI در سال 2023 و به یک دهم قدرت محاسباتی یک LLM قابل مقایسه نیاز دارد.  مدل‌های هوش مصنوعی DeepSeek در بحبوحه تحریم‌های ایالات متحده بر چین برای تراشه‌های انویدیا،توسعه یافتند که هدف آن محدود کردن توانایی کشور برای توسعه سیستم‌های هوش مصنوعی پیشرفته بود.

دیپ‌سیک با انتشار ناگهانی مدل DeepSeek-R1 با قابلیت‌های پیشرفته، توجهات جهانی را جلب کرد. این مدل با هزینه‌ای به‌مراتب کمتر، به رقیبی جدی‌ برای مدل‌های گران‌قیمت غربی تبدیل شده و بسیاری آن را هوش مصنوعی جایگزین چت جی بی تی می‌شناسند. تأثیر ساخته‌ی چینی‌ها به‌قدری گسترده بود که حتی دونالد ترامپ، رئیس‌جمهور جدید آمریکا، آن را «زنگ خطری» برای سلطه‌ی این کشور بر هوش مصنوعی دانست.

در 10 ژانویه 2025، DeepSeek اولین برنامه چت بات رایگان خود را بر اساس مدل DeepSeek-R1 برای iOS و Android منتشر کرد. در 27 ژانویه، DeepSeek-R1 از ChatGPT پیشی گرفت و به عنوان پربارگیری ترین برنامه رایگان در فروشگاه App iOS در ایالات متحده،پیشی گرفت و باعث شد که قیمت سهام انویدیا 18٪ کاهش یابد. موفقیت DeepSeek در برابر رقبای بزرگتر و معتبرتر به عنوان "هوش مصنوعی معلق" توصیف شده است،که "اولین شلیک به آنچه به عنوان یک مسابقه فضایی هوش مصنوعی جهانی در حال ظهور است" است، و آغازگر "عصر جدیدی از هوش مصنوعی است"

DeepSeek الگوریتم‌ها، مدل‌ها و جزئیات آموزشی مولد هوش مصنوعی خود را به صورت متن‌باز می‌سازد و به کد آن اجازه می‌دهد تا برای استفاده، اصلاح، مشاهده و طراحی اسناد برای اهداف ساختمانی آزادانه در دسترس باشد. طبق گزارش‌ها، این شرکت به شدت از محققان جوان هوش مصنوعی از دانشگاه‌های برتر چینی استخدام می‌کند، و از خارج از حوزه علوم رایانه برای تنوع بخشیدن به دانش و توانایی‌های مدل‌های خود استخدام می‌کند.

 

 

دیپ سیک ویکی پدیا | هوش مصنوعی رایگان

 

 

 

مدل‌های دیپ‌سیک، متن‌باز و رایگان هستند و کاربران می‌توانند مدل‌های سبک‌تر را روی سیستم‌های معمولی اجرا کنند. کسانی که امکان دانلود هوش مصنوعی دیپ سیک و اجرای محلی مدل‌ها را ندارند، می‌توانند از چت‌بات رسمی دیپ‌سیک استفاده کنند که با قابلیت‌هایی مانند آپلود فایل، جست‌وجوی وب و ویژگی DeepThink (برای تحلیل عمیق‌تر قبل از پاسخ‌گویی بر پایه‌ی مدل R1) در نسخه‌ی وب و اپلیکیشن‌های اندروید و iOS ارائه می‌شود.

برخلاف همتایان غربی که استفاده‌ی رایگان از آن‌ها محدودیت‌های زیادی دارد، هوش مصنوعی چینی جدید کاملاً رایگان بوده و از زبان فارسی نیز به‌خوبی پشتیبانی می‌کند. از همه مهم‌تر، چت‌بات دیپ‌سیک تحریم نیست و می‌توان بدون تغییر آی‌پی به آن دسترسی داشت.

 

 

 

هوش مصنوعی دیپ سیک | هوش مصنوعی رایگان

 


در فوریه 2016، High-Flyer توسط لیانگ ونفنگ، مشتاق هوش مصنوعی، که از زمان بحران مالی 2007 تا 2008 در دانشگاه ژجیانگ مشغول تجارت بود، تأسیس شد. تا سال 2019، او High-Flyer را به عنوان یک صندوق تامینی با تمرکز بر توسعه و استفاده از الگوریتم‌های معاملاتی هوش مصنوعی تأسیس کرد. تا سال 2021، High-Flyer به طور انحصاری از هوش مصنوعی در تجارت استفاده می‌کرد، اغلب از تراشه های Nvidia استفاده می‌کرد. DeepSeek چت ربات هوش مصنوعی مولد خود را منبع باز کرده است، به این معنی که کد آن به صورت رایگان برای استفاده، اصلاح و مشاهده در دسترس است. این شامل اجازه دسترسی و استفاده از کد منبع، و همچنین اسناد طراحی، برای اهداف ساختمانی است.

در سال 2021، در حالی که High-Flyer را اجرا می‌کرد، لیانگ شروع به ذخیره سازی پردازنده های گرافیکی Nvidia برای یک پروژه هوش مصنوعی کرد. با توجه به 36Kr، لیانگ یک فروشگاه از 10000 پردازنده گرافیکی Nvidia A100 ایجاد کرده بود که برای آموزش هوش مصنوعی استفاده می‌شود، قبل از اینکه دولت فدرال ایالات متحده محدودیت های تراشه های هوش مصنوعی را در چین اعمال کند.

در آوریل 2023، High-Flyer یک آزمایشگاه هوش مصنوعی را راه اندازی کرد که به تحقیق در مورد توسعه ابزارهای هوش مصنوعی جدا از تجارت مالی High-Flyer اختصاص داشت. در می‌2023، با High-Flyer به عنوان یکی از سرمایه گذاران، آزمایشگاه به شرکت خود، DeepSeek تبدیل شد. شرکت‌های سرمایه‌گذاری مخاطره‌آمیز تمایلی به تأمین بودجه نداشتند، زیرا بعید بود که بتواند در مدت زمان کوتاهی خروجی ایجاد کند.

پس از انتشار DeepSeek-V2 در ماه مه 2024، که عملکرد قوی را با قیمت پایین ارائه می‌کرد، DeepSeek به عنوان کاتالیزور جنگ قیمت مدل هوش مصنوعی چین شناخته شد. به سرعت به آن "Pinduoduo of AI" لقب گرفت و دیگر غول های فناوری بزرگ مانند ByteDance، Tencent، Baidu و Alibaba شروع به کاهش قیمت مدل های هوش مصنوعی خود کردند تا با این شرکت رقابت کنند. علیرغم قیمت پایینی که توسط DeepSeek در نظر گرفته شده بود، در مقایسه با رقبای خود که پول خود را از دست می‌دادند سودآور بود.

DeepSeek بر تحقیق متمرکز است و هیچ برنامه دقیقی برای تجاری سازی ندارد؛این همچنین به فناوری آن اجازه می‌دهد تا از سختگیرانه ترین مقررات مقررات هوش مصنوعی چین، مانند الزام فناوری مواجهه با مصرف کننده برای انطباق با کنترل های دولت بر روی اطلاعات، اجتناب کند.

اولویت‌های استخدامی DeepSeek به جای تجربه کاری، توانایی‌های فنی را هدف قرار می‌دهد، در نتیجه بیشتر استخدام‌های جدید فارغ‌التحصیلان دانشگاهی یا توسعه‌دهندگانی هستند که مشاغل هوش مصنوعی کمتری دارند. به همین ترتیب، این شرکت افرادی را بدون پیش‌زمینه علوم کامپیوتر استخدام می‌کند تا به فناوری خود کمک کند تا موضوعات و حوزه‌های دانش دیگر را درک کند، از جمله توانایی تولید شعر و عملکرد خوب در امتحانات پذیرش کالج چینی (Gaokao).

 

 

 

 

دانلود اپلیکیشن دیپ سیک | هوش مصنوعی رایگان

 

 

 

 

 

طبق گزارش36kr، لیانگ پیش از اعمال محدودیت‌های دولت ایالات متحده برای تراشه‌های هوش مصنوعی در چین، حدود ده‌هزار انویدیا A100 تهیه کرده بود. برخی برآوردها نشان می‌دهد ممکن است تعداد آن به 0 هزار هم برسد. در آوریل2023، های-فلایر یک آزمایشگاه هوش عمومی مصنوعی ایجاد کرد که روی پژوهش و توسعه ابزارهای هوش مصنوعی جدا از کسب‌وکار مالی های-فلایر متمرکز بود. در مه 2023، با همکاری یک سرمایه‌گذار جدید، یعنی های-فلایر، این آزمایشگاه به شرکتی مستقل تبدیل شد به نام دیپ‌سیک. شرکت‌های سرمایه گذاری خطر پذیر تمایل چندانی برای تأمین مالی از خود نشان نمی‌دادند، چرا که به نظر نمی‌رسید دیپ‌سیک بتواند در زمان کوتاهی خروج سرمایه را مهیا کند.

پس از عرضه DeepSeek-V2 در مه 2024 که عملکرد قدرتمندی را با هزینه اندک ارائه می‌داد، دیپ‌سیک به‌عنوان عامل آغاز جنگ قیمتی در بازار مدل‌های هوش مصنوعی چین شناخته شد. خیلی زود از آن با عنوان «پین دودوی هوش مصنوعی» یاد شد و سایر غول‌های فناوری از جملهیابت دنس، تنسنت، بایدو و علی بابا  به‌منظور رقابت با این شرکت، قیمت مدل‌های هوش مصنوعی خود را کاهش دادند. باوجود هزینه اندکی که دیپ‌سیک از مشتریان دریافت می‌کرد، همچنان سودآور بود، در حالی که رقبای آن زیان‌ده بودند. دیپ‌سیک صرفاً بر پژوهش متمرکز است و برنامه مشخصی برای تجاری‌سازی ندارد؛این موضوع همچنین به فناوری دیپ‌سیک اجازه می‌دهد از سخت‌گیرانه‌ترین مقررات چین در زمینه هوش مصنوعی، مانند قوانین مربوط به کنترل محتوای ارائه‌شده به مصرف‌کنندگان، تا حدی معاف بماند.

دیپ‌سیک ترجیح می‌دهد که استخدام‌ها مواکداً بر توانمندی فنی باشد، نه صرفاً سابقه کاری. در نتیجه بیشتر استخدام‌ها یا از دانش‌آموختگان جدید دانشگاه‌ها هستند یا توسعه‌دهندگانی با سابقه کمتر در حوزه هوش مصنوعی. همچنین این شرکت افرادی را بدون پیشینه علمی در علوم رایانه جذب می‌کند تا توانایی فناوری آن در درک موضوعات و حوزه‌های دانشی دیگر افزایش یابد و بتواند مثلاً شعر بسراید یا در کنکور سخت دانشگاه های چین عملکرد خوبی نشان دهد.

 

 

“DeepSeek چیست؟  | هوش مصنوعی رایگان

 

 

 

تاریخچه توسعه و انتشار هوش مصنوعی دیپ سیک DeepSeek

در 2 نوامبر 2023، DeepSeek اولین سری مدل خود را با نام DeepSeek-Coder منتشر کرد که به صورت رایگان برای محققان و کاربران تجاری در دسترس است. کد مدل تحت مجوز MIT به‌صورت متن‌باز ساخته شد، با یک قرارداد مجوز اضافی ("مجوز DeepSeek") در رابطه با "استفاده باز و مسئول پایین دست" برای خود مدل.

آنها از همان معماری DeepSeek LLM هستند که در زیر توضیح داده شده است. این سری شامل 8 مدل، 4 مدل از پیش آموزش دیده (Base) و 4 مدل آموزش دقیق (Instruct) است. همه آنها دارای طول زمینه 16K هستند. آموزش به شرح زیر بود:

  • پیش آموزش: 1.8T توکن (87٪ کد منبع، 10٪ انگلیسی مربوط به کد (GitHub markdown and Stack Exchange) و 3٪ چینی غیر مرتبط با کد).
  • پیش‌آموزش با زمینه طولانی: 200 میلیارد توکن. این طول زمینه را از 4K به 16K افزایش می‌دهد. این مدل های پایه را تولید کرد.
  • تنظیم دقیق نظارت شده (SFT): 2 میلیارد توکن داده دستورالعمل. این مدل‌های Instruct را تولید کرد.

آنها بر روی خوشه‌هایی از پردازنده‌های گرافیکی Nvidia A100 و H800 آموزش دیده‌اند که توسط InfiniBand، NVLink، NVSwitch وصل شده‌اند.

 

در 29 نوامبر 2023، DeepSeek سری مدل‌های DeepSeek-LLM را با پارامترهای 7B و 67B در هر دو فرم Base و Chat منتشر کرد (هیچ دستورالعملی منتشر نشد). این برای رقابت با سایر LLM های موجود در آن زمان توسعه داده شد. این مقاله ادعا کرد که نتایج معیار بالاتر از بسیاری از LLM های منبع باز در آن زمان، به ویژه Llama 2 است.

معماری اساساً همان معماری سری لاما بود. آنها از ترانسفورماتور فقط رمزگشای پیش-هنجار با RMSNorm به عنوان عادی سازی، SwiGLU در لایه های پیشخور، تعبیه موقعیتی چرخشی (RoPE) و توجه پرس و جوی گروهی (GQA) استفاده کردند. هر دو دارای حجم واژگان 102400 (BPE در سطح بایت) و طول متن 4096 بودند. آنها بر روی 2 تریلیون نشانه متن انگلیسی و چینی که با حذف کپی کردن Common Crawl به دست آمده بودند، آموزش دیدند.

نسخه‌های چت دو مدل پایه نیز به طور همزمان منتشر شد، که با آموزش Base توسط تنظیم دقیق نظارت شده (SFT) و به دنبال آن بهینه‌سازی سیاست مستقیم (DPO) به دست آمد.

در 9 ژانویه 2024، آنها 2 مدل DeepSeek-MoE (Base، Chat)، هر کدام از 16B پارامتر (2.7B فعال در هر توکن، طول زمینه 4K) منتشر کردند. این آموزش اساساً مشابه DeepSeek-LLM 7B بود و بر روی بخشی از مجموعه داده آموزشی آن آموزش داده شد. آنها ادعا کردند عملکرد قابل مقایسه با 16B MoE به عنوان 7B غیر MoE. در معماری، این گونه‌ای از MOE استاندارد با دروازه‌های پراکنده است، با «متخصصان مشترک» که همیشه مورد پرسش قرار می‌گیرند، و «متخصصان مسیریابی» که ممکن است نباشند. آنها دریافتند که این به تعادل متخصص کمک می‌کند. در MOE استاندارد، می‌توان به برخی از کارشناسان بیش از حد اعتماد کرد، در حالی که ممکن است کارشناسان دیگر به ندرت مورد استفاده قرار گیرند و پارامترها را هدر دهند. تلاش برای ایجاد تعادل بین متخصصان به گونه ای که از آنها به طور یکسان استفاده شود، باعث می‌شود کارشناسان همان ظرفیت را تکرار کنند. آنها کارشناسان مشترک را برای یادگیری ظرفیت های اصلی که اغلب استفاده می‌شود، پیشنهاد کردند، و به متخصصان مسیریابی اجازه دادند تا ظرفیت های جانبی را که به ندرت استفاده می‌شود، بیاموزند.

در آوریل 2024، آنها 3 مدل DeepSeek-Math را که برای انجام ریاضیات تخصصی بودند منتشر کردند: Base، Instruct، RL. به شرح زیر آموزش داده شد:

با DeepSeek-Coder-Base-v1.5 7B که قبلاً از قبل آموزش داده شده بود، راه اندازی کنید.
پیش‌آموزش بیشتر با 500 میلیارد توکن (6% DeepSeekMath Corpus، 4% AlgebraicStack، 10% arXiv، 20% کد GitHub، 10% Common Crawl). این مدل پایه را تولید کرد.
یک مدل پیروی از دستورالعمل توسط SFT Base با 776K مسائل ریاضی و راه حل های گام به گام یکپارچه با استفاده از ابزار آنها را آموزش دهید. این مدل Instruct را تولید کرد.
یادگیری تقویتی (RL): مدل پاداش یک مدل پاداش فرآیند (PRM) بود که از Base طبق روش Math-Shepherd آموزش داده شد.[31] سپس این مدل پاداش برای آموزش Instruct با استفاده از بهینه‌سازی خط مشی نسبی گروهی (GRPO) روی مجموعه داده‌ای از 144 هزار سؤال ریاضی «مربوط به GSM8K و MATH» استفاده شد. مدل پاداش به طور مداوم در طول آموزش به روز می‌شد تا از هک پاداش جلوگیری شود. این منجر به مدل RL شد.

 

V2

در ماه مه 2024، آنها سری DeepSeek-V2 را منتشر کردند. این سری شامل 4 مدل، 2 مدل پایه (DeepSeek-V2، DeepSeek-V2-Lite) و 2 ربات چت (-Chat) است. دو مدل بزرگتر به شرح زیر آموزش داده شدند:

پیش آموزش روی مجموعه داده ای از توکن های 8.1T، که در آن توکن های چینی 12 درصد بیشتر از نمونه های انگلیسی هستند. با استفاده از YaRN، طول زمینه را از 4K به 128K افزایش دهید. این منجر به DeepSeek-V2 شد. SFT با 1.2M نمونه برای مفید بودن و 0.3M برای ایمنی. این منجر به DeepSeek-V2-Chat (SFT) شد که منتشر نشد. RL با استفاده از GRPO در دو مرحله. مرحله اول برای حل مسائل ریاضی و کدگذاری آموزش داده شد. در این مرحله از 1 مدل پاداش، آموزش داده شده بر روی بازخورد کامپایلر (برای کدنویسی) و برچسب‌های حقیقت پایه (برای ریاضی) استفاده شد. مرحله دوم برای مفید بودن، ایمن بودن و پیروی از قوانین آموزش داده شد. در این مرحله از 3 مدل پاداش استفاده شد. مدل‌های پاداش مفید و ایمنی بر روی داده‌های ترجیحات انسانی آموزش داده شدند. مدل پاداش مبتنی بر قانون به صورت دستی برنامه ریزی شد. همه مدل های پاداش آموزش دیده از DeepSeek-V2-Chat (SFT) مقداردهی اولیه شدند. این منجر به نسخه منتشر شده DeepSeek-V2-Chat شد. آنها RL 2 مرحله ای را انتخاب کردند، زیرا دریافتند که RL در داده های استدلالی دارای "ویژگی های منحصر به فرد" متفاوت از RL در داده های عمومی است. به عنوان مثال، RL در استدلال می‌تواند بیش از مراحل آموزشی بیشتر بهبود یابد.

دو مدل V2-Lite کوچکتر بودند و به طور مشابه آموزش دیدند، اگرچه DeepSeek-V2-Lite-Chat فقط تحت SFT قرار گرفت، نه RL. آنها نسخه Lite را برای کمک به "تحقیق و توسعه بیشتر در مورد MLA و DeepSeekMoE" آموزش دادند. از نظر معماری، مدل های V2 به طور قابل توجهی از سری DeepSeek LLM اصلاح شدند. آنها مکانیسم توجه استاندارد را با یک تقریب رتبه پایین به نام توجه نهفته چند سر (MLA) تغییر دادند و از ترکیبی از متخصصان (MoE) که قبلاً در ژانویه منتشر شده بود استفاده کردند.

 

فایننشال تایمز گزارش داد که ارزان تر از همتایان خود با قیمت 2 RMB برای هر میلیون توکن خروجی است. تابلوی امتیازات آزمایشگاه ببر دانشگاه واترلو، DeepSeek-V2 را در رتبه هفتم رتبه بندی LLM خود قرار داد.

در ژوئن 2024، آنها 4 مدل را در سری DeepSeek-Coder-V2 منتشر کردند: V2-Base، V2-Lite-Base، V2-Instruct، V2-Lite-Instruct. آنها به شرح زیر آموزش دیدند:

مدل‌های پایه پس از پیش‌آموزش روی توکن‌های 4.2T (نه نسخه‌ای در پایان پیش‌آموزش) از نقاط بازرسی میانی مربوطه اولیه‌سازی شدند، سپس برای توکن‌های 6T پیش‌آموزش داده شدند، سپس به طول زمینه 128K گسترش یافتند. این مدل های پایه را تولید کرد.
DeepSeek-Coder و DeepSeek-Math برای تولید 20K داده دستورالعمل مرتبط با کد و 30K داده های دستورات ریاضی مورد استفاده قرار گرفتند، سپس با مجموعه داده دستورالعملی از 300 میلیون توکن ترکیب شدند. این برای SFT استفاده شد. RL با GRPO. پاداش برای مسائل ریاضی با مقایسه با برچسب حقیقت پایه محاسبه شد. پاداش برای مشکلات کد توسط یک مدل پاداش ایجاد شد که برای پیش‌بینی اینکه آیا یک برنامه آزمون‌های واحد را پشت سر می‌گذارد آموزش دیده بود. DeepSeek-V2.5 در سپتامبر منتشر شد و در دسامبر 2024 به روز شد. با ترکیب DeepSeek-V2-Chat و DeepSeek-Coder-V2-Instruct ساخته شد.

 

 

استفاده از دیپ سیک | هوش مصنوعی رایگان

 

 

V3

در دسامبر 2024، آنها یک مدل پایه DeepSeek-V3-Base و یک مدل چت DeepSeek-V3 را منتشر کردند. معماری مدل اساساً مشابه V2 است. آنها به شرح زیر آموزش دیدند:

  • پیش‌آموزش روی ژتون‌های 14.8T یک مجموعه چند زبانه، عمدتا انگلیسی و چینی. نسبت ریاضی و برنامه‌نویسی بالاتری نسبت به مجموعه داده‌های پیش‌آموزشی V2 داشت.
  • با استفاده از YaRN، طول زمینه را دو بار، از 4K به 32K و سپس به 128K افزایش دهید. این DeepSeek-V3-Base را تولید کرد.
  • SFT برای 2 دوره بر روی 1.5 میلیون نمونه داده های استدلالی (ریاضی، برنامه نویسی، منطق) و غیر استدلالی (نوشتن خلاق، نقش آفرینی، پاسخ به سؤال ساده). داده های استدلالی توسط "مدل های خبره" تولید شد. داده های غیر منطقی توسط DeepSeek-V2.5 تولید و توسط انسان بررسی شد.

- «مدل‌های خبره» با شروع با یک مدل پایه نامشخص، سپس SFT بر روی داده‌های <مشکل، پاسخ اصلی> و داده‌های مصنوعی <سیستم اعلان، مشکل، پاسخ R1> که توسط یک مدل داخلی DeepSeek-R1 تولید می‌شوند، آموزش داده شدند. اعلان سیستم از R1 خواست تا در حین تفکر بازتاب و تأیید کند. سپس مدل های خبره با استفاده از یک تابع پاداش نامشخص RL بودند.
- هر مدل متخصص برای تولید داده‌های استدلال مصنوعی در یک حوزه خاص (ریاضی، برنامه‌نویسی، منطق) آموزش داده شد.
- از مدل های خبره به جای خود R1 استفاده شد، زیرا خروجی خود R1 دچار "تفکر بیش از حد، قالب بندی ضعیف و طول بیش از حد" بود.

 

مدل‌های پاداش مبتنی بر مدل با شروع با یک نقطه بازرسی SFT از V3، سپس تنظیم دقیق داده‌های ترجیحی انسانی که شامل پاداش نهایی و زنجیره‌ای از فکر است که منجر به پاداش نهایی می‌شود، ساخته شدند. مدل پاداش برای هر دو سؤال با پاسخ های عینی اما آزاد و سؤالات بدون پاسخ عینی (مانند نوشتن خلاقانه) سیگنال های پاداش تولید می‌کند. یک ایست بازرسی SFT از V3 توسط GRPO با استفاده از هر دو مدل پاداش و پاداش مبتنی بر قانون آموزش داده شد. پاداش مبتنی بر قانون برای مسائل ریاضی با پاسخ نهایی (در یک جعبه قرار داده شده) و برای مسائل برنامه نویسی با آزمون های واحد محاسبه شد. این DeepSeek-V3 را تولید کرد.

 

R1

در 20 نوامبر 2024، DeepSeek-R1-Lite-Preview از طریق API DeepSeek و همچنین از طریق رابط چت پس از ورود به سیستم در دسترس قرار گرفت. حل مسئله در زمان واقعی DeepSeek ادعا کرد که از عملکرد OpenAI o1 در معیارهایی مانند آزمون ریاضی دعوتی آمریکا (AIME) و MATH فراتر رفته است. با این حال، وال استریت ژورنال بیان کرد که وقتی از 15 مسئله از نسخه 2024 AIME استفاده کرد، مدل o1 سریعتر از DeepSeek-R1-Lite-Preview به راه حل رسید. در 20 ژانویه 2025، DeepSeek DeepSeek-R1 و DeepSeek-R1-Zero را منتشر کرد. هر دو از DeepSeek-V3-Base مقداردهی اولیه شده اند و معماری آن را به اشتراک می‌گذارند. این شرکت همچنین برخی از مدل‌های «DeepSeek-R1-Distill» را منتشر کرد که در V3-Base مقداردهی اولیه نشده‌اند، اما در عوض از دیگر مدل‌های وزن باز از پیش آموزش‌دیده، از جمله LLaMA و Qwen اولیه‌سازی شده‌اند، سپس بر روی داده‌های مصنوعی تولید شده توسط R1 تنظیم شده‌اند.

DeepSeek-R1-Zero منحصراً با استفاده از GRPO RL بدون SFT آموزش داده شد. برخلاف نسخه‌های قبلی، آنها از پاداش مبتنی بر مدل استفاده نمی‌کردند. همه توابع پاداش مبتنی بر قانون بودند، "عمدتا" از دو نوع (انواع دیگر مشخص نشد): پاداش دقت و پاداش قالب. پاداش دقت بررسی این بود که آیا یک پاسخ جعبه ای درست است (برای ریاضی) یا اینکه آیا یک کد در آزمون ها (برای برنامه نویسی) موفق است یا خیر. پاداش قالب بررسی این بود که آیا مدل ردپای تفکر خود را در <think>...</think> قرار می‌دهد یا خیر.

 

از آنجایی که R1-Zero مشکلاتی با خوانایی و اختلاط زبان ها دارد، R1 برای رسیدگی به این مسائل و بهبود بیشتر استدلال آموزش داده شد:

  1. SFT DeepSeek-V3-Base بر روی "هزاران" داده "شروع سرد" همه با قالب استاندارد |special_token|<reasoning_process>|special_token|summary>.
  2. همان فرآیند RL را مانند R1-Zero اعمال کنید، اما همچنین با "پاداش سازگاری زبان" برای تشویق آن به پاسخگویی تک زبانه استفاده کنید. این یک مدل داخلی تولید کرد که عرضه نشد.
  3. 600K داده استدلال را از مدل داخلی، با نمونه‌گیری رد ترکیب کنید (یعنی اگر استدلال تولید شده پاسخ نهایی اشتباه داشت، حذف می‌شود). با استفاده از DeepSeek-V3، 200 هزار داده غیر استدلالی (نوشتن، QA واقعی، خودشناسی، ترجمه) ترکیب کنید.
  4. SFT DeepSeek-V3-Base بر روی داده های مصنوعی 800K برای 2 دوره.
  5. GRPO RL با پاداش مبتنی بر قانون (برای کارهای استدلالی) و پاداش مبتنی بر مدل (برای کارهای غیر استدلالی، مفید بودن و بی ضرر بودن). این DeepSeek-R1 را تولید کرد.

مدل‌های مقطر توسط SFT بر روی داده‌های 800K سنتز شده از DeepSeek-R1، به روشی مشابه مرحله 3 بالا، آموزش داده شدند. آنها با RL آموزش ندیده بودند.

 

 

 

هوش مصنوعی deepseek

 

 

ارزیابی و واکنش ها در هوش مصنوعی DeepSeek

DeepSeek دستیار هوش مصنوعی خود را منتشر کرد که از مدل V3 به عنوان یک برنامه چت بات برای Apple IOS و Android استفاده می‌کند. تا 27 ژانویه 2025، این برنامه از ChatGPT پیشی گرفت و بالاترین امتیاز را در اپ استور iOS در ایالات متحده داشت. ربات چت آن بر اساس تست‌های معیاری که شرکت‌های هوش مصنوعی آمریکایی استفاده می‌کنند، ظاهراً به سؤالات پاسخ می‌دهد، مشکلات منطقی را حل می‌کند، و برنامه‌های رایانه‌ای را همتراز با دیگر چت‌بات‌های موجود در بازار می‌نویسد.

DeepSeek-V3 در مقایسه با همتایان خود از منابع بسیار کمتری استفاده می‌کند. برای مثال، در حالی که شرکت‌های پیشرو هوش مصنوعی جهان چت‌بات‌های خود را با ابررایانه‌ها با استفاده از 16000 واحد پردازش گرافیکی (GPU) آموزش می‌دهند، اما DeepSeek ادعا می‌کند که تنها به حدود 2000 پردازنده گرافیکی، یعنی چیپ سری H800 از Nvidia نیاز داشته است. این در حدود 55 روز با هزینه 5.58 میلیون دلار آمریکا آموزش داده شد، که تقریباً یک دهم هزینه ای است که غول فناوری ایالات متحده متا برای ساخت آخرین فناوری هوش مصنوعی خود هزینه کرده است. DeepSeek-V3 در مقایسه با همتایان خود از منابع بسیار کمتری استفاده می‌کند. برای مثال، در حالی که شرکت‌های پیشرو هوش مصنوعی جهان چت‌بات‌های خود را با ابررایانه‌ها با استفاده از 16000 واحد پردازش گرافیکی (GPU) آموزش می‌دهند، اما DeepSeek ادعا می‌کند که تنها به حدود 2000 پردازنده گرافیکی، یعنی چیپ سری H800 از Nvidia نیاز داشته است. این در حدود 55 روز با هزینه 5.58 میلیون دلار آمریکا آموزش داده شد، [38] که تقریباً یک دهم هزینه ای است که غول فناوری ایالات متحده متا برای ساخت آخرین فناوری هوش مصنوعی خود هزینه کرده است. عملکرد رقابتی DeepSeek با هزینه نسبتاً حداقل به عنوان به طور بالقوه به چالش کشیدن سلطه جهانی مدل های هوش مصنوعی آمریکایی شناخته شده است.نشریات و رسانه های خبری مختلف، مانند The Hill و The Guardian، انتشار ربات چت آن را به عنوان "لحظه اسپوتنیک" برای هوش مصنوعی آمریکایی توصیف کردند.عملکرد مدل R1 آن در زمانی که برای کارهایی مانند ریاضیات، کدنویسی و استدلال زبان طبیعی استفاده می‌شود، طبق گزارش «همتراز» با یکی از جدیدترین مدل‌های OpenAI بود؛ با تکرار دیگر مفسران، مارک آندریسن، سرمایه‌دار آمریکایی سیلیکون ولی، R1 را نیز توصیف کرد. به عنوان "لحظه اسپوتنیک هوش مصنوعی". بنیانگذار DeepSeek، لیانگ ونفنگ، با سام آلتمن، مدیر عامل هوش مصنوعی Open مقایسه شده است، و CNN او را سم آلتمن چین و بشارت دهنده هوش مصنوعی می‌نامد. رسانه های دولتی چین به طور گسترده ای DeepSeek را به عنوان یک دارایی ملی ستایش کردند در 20 ژانویه 2025، لی کیانگ، نخست وزیر چین، لیانگ ونفنگ را به سمپوزیوم خود با کارشناسان دعوت کرد و از او خواست تا نظرات و پیشنهاداتی را در مورد پیش نویسی برای نظرات گزارش کار سالانه دولت 2024 ارائه کند. بهینه‌سازی منابع محدود توسط DeepSeek محدودیت‌های بالقوه تحریم‌های ایالات متحده بر توسعه هوش مصنوعی چین را برجسته کرده است که شامل محدودیت‌های صادراتی تراشه‌های هوش مصنوعی پیشرفته به چین می‌شود. در نتیجه موفقیت مدل‌های هوش مصنوعی این شرکت باعث آشفتگی در بازار شد و باعث شد که سهام شرکت‌های بزرگ فناوری جهانی در 27 ژانویه 2025 سقوط کند: سهام انویدیا به اندازه 17 تا 18 درصد کاهش یافت. رقیب Broadcom سایر شرکت های فناوری نیز غرق شدند، از جمله مایکروسافت (افت 2.5 درصدی)، مالک آلفابت گوگل (کاهش بیش از 4 درصد)، و سازنده تجهیزات تراشه هلندی ASML (کاهش بیش از 7 درصد). فروش جهانی سهام فناوری نزدک، به دلیل انتشار مدل R1، منجر به زیان بی سابقه ای در حدود 593 میلیارد دلار در ارزش بازار شرکت های هوش مصنوعی و سخت افزار رایانه شده بود؛ تا 28 ژانویه 2025، در مجموع 1 دلار. تریلیون ها ارزش از سهام آمریکا پاک شد. چهره‌های پیشرو در بخش هوش مصنوعی آمریکا واکنش‌های متفاوتی به موفقیت و عملکرد DeepSeek داشتند. ساتیا نادلا، مدیر عامل مایکروسافت و سام آلتمن، مدیر عامل OpenAI - که شرکت‌هایشان در پروژه "Stargate Project" تحت حمایت دولت ایالات متحده برای توسعه زیرساخت‌های هوش مصنوعی آمریکایی مشارکت دارند - هر دو DeepSeek را "فوق العاده چشمگیر" نامیدند.  دونالد ترامپ، رئیس جمهور آمریکا، که پروژه دروازه ستاره ای را اعلام کرد، DeepSeek را یک زنگ بیدارباش و یک پیشرفت مثبت نامید.  رهبران دیگر در این زمینه، از جمله الکساندر وانگ، مدیرعامل Scale AI، داریو آمودی، بنیانگذار و مدیر عامل Anthropic، و ایلان ماسک نسبت به عملکرد برنامه یا پایداری موفقیت آن ابراز تردید کردند. شرکت های مختلفی از جمله خدمات وب آمازون، تویوتا و استرایپ به دنبال استفاده از این مدل در برنامه خود هستند. در 27 ژانویه 2025، DeepSeek ثبت نام کاربر جدید خود را به شماره تلفن های سرزمین اصلی چین، آدرس های ایمیل، یا ورود به حساب های Google محدود کرد، به دنبال یک حمله سایبری "در مقیاس وسیع" که عملکرد صحیح سرورهایش را مختل کرد.

 

هوش مصنوعی دیپ سیک DeepSeek مدل DeepSeek V3

مدل DeepSeek V3 یکی از پیشرفته‌ترین مدل‌های هوش مصنوعی استارتاپ چینی دیپ‌سیک است که در تاریخ 26 دسامبر 2024 (6 دی) معرفی شد. دیپ‌سیک هوش مصنوعی جدید خود را بر پایه‌ی معماری Mixture of Experts (MoE) طراحی کرد. در این معماری، مدل کلی هوش مصنوعی از چندین «متخصص» (زیرمدل) تشکیل شده است که تنها تعداد محدودی از آن‌ها در هر درخواست بنا به‌ نیاز فعال می‌شوند. این طراحی هوشمندانه مصرف منابع را کاهش داده و کارایی مدل را افزایش می‌دهد.

DeepSeek V3 با 671 میلیارد پارامتر طراحی شده است؛ اما در هر درخواست تنها 37 میلیارد پارامتر فعال می‌شوند. deep seek هوش مصنوعی V3 را تنها در مدت 2 ماه (نزدیک به 2.8 میلیون ساعت GPU) با 2048 پردازنده‌ی انویدیا H800 و با هزینه‌ای معادل 5.58 میلیون دلار آموزش داد. برای مقایسه، متا برای آموزش LLaMA 3 با 405 میلیارد پارامتر، ۱۱ برابر منابع بیشتر (30.8 میلیون ساعت GPU) مصرف کرد.

 

 

 

هوش مصنوعی دیپ سیک چیست

 

 

DeepSeek V3 در حوزه‌های متنوعی مانند پردازش زبان طبیعی (NLP)، ریاضیات و برنامه‌نویسی عملکرد چشمگیری دارد. در آزمون‌ استانداردی مانند MMLU (دانش چندزمینه‌ای)، این مدل کارایی ۸۸٫۵ درصدی را کسب کرد. در آزمون‌های استاندارد مانند Math-500، این مدل با دقت 90.2 درصد از GPT-4o (با74.6 درصد) پیشی گرفته و در تحلیل فایل‌های PDF و ارائه‌ی پاسخ‌های شخصی‌سازی‌شده نیز عملکرد برجسته‌ای از خود نشان داد. در مقابل، مدل‌های پیشرفته‌ای مانند GPT-4o یا Claude 3.5 Sonnet در زمینه‌ی خلاقیت و تولید ایده، به‌ویژه در حوزه‌های تحقیقاتی پیچیده، همچنان نسبت‌به DeepSeek V3 برتری دارند.

مدل DeepSeek R1: تغییر قواعد بازی

اوج موفقیت دیپ‌سیک، با معرفی مدل DeepSeek-R1 در تاریخ 20 ژانویه (یک بهمن) رقم خورد. این مدل بر پایه‌ی DeepSeek V3 و با استفاده از ترکیبی از یادگیری تقویتی (Reinforcement Learning) و تنظیم دقیق نظارت‌شده (SFT) آموزش دیده است. این رویکرد، توانایی استدلال منطقی و زنجیره‌ای را در این مدل تقویت کرده و آن را برای حل مسائل پیچیده و کاربردهای استدلال‌محور به گزینه‌ای ایده‌آل تبدیل می‌کند.

مانند DeepSeek V3، مدل R1 نیز از معماری MoE بهره می‌برد و تنها 37 میلیارد پارامتر آن در هر درخواست فعال می‌شود. این طراحی هوشمندانه با کاهش هزینه‌ها تا 90 درصد، به DeepSeek-R1 اجازه می‌دهد تنها با کسری از هزینه‌، در مواردی مانند ریاضیات، کدنویسی و استدلال با مدل پیشرفته‌ای مانند o1 از OpenAI رقابت کند و در برخی موارد از آن‌ پیشی بگیرد.

 

 

هوش مصنوعی دیپ سیک برای کدام کشور است؟

 

 

 

 

DeepSeek-R1 در حوزه‌ی ریاضیات پیشرفته در آزمون‌ AIME 2024 امتیاز 79.8درصد (بالاتر از 79.2 درصدی مدل o1 از OpenAI) و در آزمون MATH-500 امتیاز 97.3 درصد را کسب کرد. R1 در بحث برنامه‌نویسی، با کسب امتیاز 2028 در آزمون Codeforces، نسبت به 96.3 درصد از برنامه نویسان انسانی عملکرد بهتری از خود نشان داد. در نهایت، مدل پیشرفته‌ی R1 توانست با به دست آوردن دقت 92.2 درصد در drop (3-shot F1) و 90.8 درصد در MMLU، عملکردی نزدیک به مدل o1 (با امتیاز 92.3 درصد) داشته باشد. مدل‌o1 از OpenAI برای هر میلیون توکن ورودی15 دلار و برای هر میلیون توکن خروجی 60 دلار هزینه دارد؛ این مقادیر برای DeepSeek-R1 برای هر میلیون توکن ورودی 0.55 دلار و برای خروجی 2.19 دلار هستند؛ یعنی27 برابر ارزان‌تر. مدل‌های DeepSeek V3 و R1 از دیپ‌سیک برای دانلود و اجرای لوکال از طریق گیت‌هاب و Hugging Face در دسترس علاقه‌مندان قرار دارند. این مدل‌ها با مجوز MIT منتشر شده‌اند و استفاده‌ی تجاری و تغییرات آزادانه در آن‌ها امکان‌پذیر است. با‌این‌حال، منابع بسیار زیادی که نصب دیپ سیک و اجرای آن به‌طور لوکال طلب می‌کند، بسیاری را به نسخه‌ی وب هوش مصنوعی چینی ها سوق می‌دهد.

ثبت‌نام و استفاده از دیپ سیک (نسخه‌ی وب)

همان‌طور که پیش‌تر اشاره شد،‌ می‌توان بدون نیاز به ابزارهای تغییر آی‌پی و تنها با ثبت‌نام از طریق ایمیل، به‌صورت رایگان به هوش مصنوعی دیپسیک دسترسی داشت و از آن استفاده کرد.

 

1- برای ثبت‌نام در سایت deep seek ابتدا صفحه‌ی لاگین را از طریق لینک زیر باز کنید:

 

 

 

 

2- اگر حساب گوگل دارید، می‌توانید گزینه‌ی Log in with Google را انتخاب کنید و با استفاده از حساب گوگل خود ثبت‌نام را تکمیل کنید و وارد حساب دیپ‌سیک خود شوید.

3- اگر ترجیح می‌دهید برای ثبت‌نام در سایت دیپسیک از ایمیل دیگری استفاده کنید:

  • روی دکمه‌ی Sign Up کلیک کنید.
  • آدرس ایمیل خود و یک رمز عبور دلخواه (همراه با تکرار رمز عبور) را وارد کنید.
  • گزینه‌ی Send code را بزنید تا کد تأیید به ایمیل شما ارسال شود.
  • کد دریافتی را در کادر مشخص‌شده وارد کنید.
  • با تیک زدن گزینه موافقت با قوانین و شرایط استفاده، روی دکمه‌ی Sign Up کلیک کنید تا اکانت دیپ‌ سیک شما ایجاد شود.
  • پس از ثبت‌نام به صفحه‌ی لاگین برگردید و پس وارد کردن اطلاعات ورود خود و زدن تیک گزینه‌ی موافقت با قوانین، روی دکمه‌ی Log in بزنید.

 

 

هوش مصنوعی رایگان دیپ سیک

 

 

 

استفاده از نسخ وب هوش مصنوعی دیپ‌ سیک

هوش مصنوعی آنلاین دیپ‌ سیک با رابط کاربری ساده و روان طراحی شده است. برای استفاده، باید دستور یا سؤال خود را در کادر متنی وسط صفحه وارد کنید و با زدن کلید Enter یا کلیک روی آیکون فلش ارسال، منتظر پاسخ دیپ‌سیک باشید.

 

 

 

نسخ وب هوش مصنوعی deepseek

 

 

 

 

جستجوی وب داخل   هوش مصنوعی دیپ‌ سیکDeepSeek

برای دریافت پاسخ‌هایی که بر اساس اطلاعات به‌روز اینترنت ارائه می‌شوند، ابتدا قابلیت جستجوی وب را با کلیک روی دکمه‌ی Search فعال کنید. سپس سؤال خود را وارد و ارسال کنید. دیپ‌ سیک اینترنت را جست‌وجو می‌کند و تعداد منابعی را که برای پاسخ‌دهی استفاده کرده است، در بالای کادر پاسخ به شما نشان می‌دهد.

 

 

جست و جو در هوش مصنوعی دیپ سیک

 

 

می‌توانید با کلیک روی این بخش، لیست وب‌سایت‌هایی که دیپ‌ سیک به آن‌ها رجوع کرده، مشاهده کنید. همچنین، در محتوای پاسخ، شماره منابع مرتبط به هر بخش ذکر شده است تا در صورت نیاز به منبع اصلی مراجعه کنید.

 

حالت DeepThink R1 برای پردازش عمیق

قابلیت DeepThink R1 در دیپ سیک یکی از ویژگی‌های خاص است که برای حل مسائل پیچیده مانند تحلیل‌های فنی یا مسائل ریاضی پیشرفته کاربرد دارد. با فعال کردن این حالت از پایین سمت چپ کادر دستور، هنگام سؤال از هوش مصنوعی، دیپ‌ سیک پرسش شما را به بخش‌های کوچک‌تر تقسیم می‌کند و پاسخی دقیق‌تر و تفکیک‌شده ارائه می‌دهد.

در حالت یادشده، فرایند پاسخ‌دهی کمی طولانی‌تر است (بین ۱۰ تا ۲۰ ثانیه)؛ اما کیفیت پاسخ‌ها به‌طور محسوسی افزایش می‌یابد. همچنین، کاربران می‌توانند روند تفکر و تحلیل درونی دیپ‌ سیک را حین پردازش مشاهده کنند.

 

آپلود فایل به هوش مصنوعی دیپ‌ سیک

برای آپلود فایل در دیپ‌ سیک، باید روی آیکون گیره‌ی کاغذ در پایین سمت راست کادر دستور کلیک کنید. این قابلیت از فرمت‌های مختلف (PDF, DOCX, PPT, TXT, XLSX) و تصاویر پشتیبانی می‌کند. هر فایل می‌تواند حداکثر ۱۰۰ مگابایت حجم داشته باشد، و امکان آپلود همزمان تا ۵۰ فایل وجود دارد. بااین‌حال، دیپ‌ سیک تنها قادر به استخراج و تحلیل متن موجود در این فایل‌ها است.

پس از آپلود فایل، می‌توانید در کادر متنی دستور خود را وارد کنید؛ برای مثال، درخواست خلاصه‌سازی یک مقاله یا پاسخ به سؤال درباره‌ی محتوای فایل. سپس دستور را ارسال کنید تا دیپ‌ سیک، درخواست شما را بر اساس متن فایل اجرا کند.

تعامل با پاسخ‌ها هوش مصنوعی دیپ‌ سیک

در پایین سمت راست هر پاسخ دیپ‌سیک، گزینه‌هایی مانند: کپی کردن پاسخ، ایجاد دوباره پاسخ (Regenerate)، لایک و دیس‌لایک وجود دارد تا بتوانید با محتوا تعامل کنید.

 

هوش مصنوعی deepseek

 

 

همچنین، اگر نشانگر ماوس را روی دستورات ارسالی خود قرار دهید، گزینه‌های ویرایش دستور و کپی دستور در سمت راست کادر ظاهر می‌شوند.

 

جابه‌جایی بین دستورات و پاسخ‌ها در هوش مصنوعی DeepSeek

پس از هر بار تغییر دستور یا ایجاد دوباره‌ی پاسخ هنگام سؤال از هوش مصنوعی، فلش‌هایی در زیر دستور یا پاسخ ظاهر می‌شوند که به شما امکان جابه‌جایی بین نسخه‌های مختلف دستورات و پاسخ‌ها را می‌دهند.

 

تاریخچه مکالمات در هوش مصنوعی DeepSeek

تمام مکالمات شما در بخش منوی کناری سمت چپ ذخیره می‌شوند. با کلیک روی سه‌نقطه افقی کنار هر مکالمه می‌توانید نام آن را تغییر دهید یا مکالمه را حذف کنید.

 

 

 

هوش مصنوعی چینی deepseek دانلود

 

 

 

 

تنظیمات و پروفایل کاربری در هوش مصنوعی DeepSeek

برای دسترسی به تنظیمات و گزینه‌های دیگر، روی قسمت My Profile در منوی کناری کلیک کنید.

 

 

 

تنظیمات پروفایل در هوش مصنوعی دیپ سیک

 

 

 

در این بخش با کلیک روی Settings و مراجعه به تب General، می‌توانید تم دیپ‌ سیک را بین حالت روشن و تاریک تغییر دهید یا زبان رابط کاربری را تنظیم کنید (درحال‌حاضر فقط زبان‌های چینی و انگلیسی موجود است).

 

 

تب Profile در تنظیمات دیپ‌سیک

تب General در تنظیمات دیپ‌سیک

 

 

در تب Profile، امکان حذف کامل حساب کاربری وجود دارد؛ علاوه‌بر‌این، می‌توانید از گزینه Log out برای خروج از حساب فعلی استفاده کنید یا با یک کلیک تمامی مکالمات خود را پاک کنید.

 

ثبت‌نام و استفاده از اپلیکیشن دیپ سیک DeepSeek در تلفن همراه

برای استفاده از هوش مصنوعی دیپ سیک در موبایل ابتدا باید نسخه‌ی مناسب گوشی خود را از طریق صفحه‌ی دانلود برنامه دیپ سیک در گوگل‌پلی یا اپ‌استور اپل دانلود کنید.

 

فرآیند ثبت‌نام در نرم افزار deepseek موبایل کاملاً شبیه ثبت‌نام در نسخه‌ی وب آن است. پس از دانلود هوش مصنوعی deepseek و باز کردن اپ، می‌توانید با گزینه‌ی Sign Up وارد صفحه‌ی ثبت‌نام شوید و پس از تکمیل آن با ایمیل و پسورد خود به اپلیکیشن deepseek وارد شوید. امکان ورود با اکانت گوگل نیز فراهم است.

 

 

 

ثبت‌نام و استفاده از اپلیکیشن دیپ سیک  DeepSeek

 

 

 

 

 

استفاده از هوش مصنوعی دیپ‌ سیک DeepSeekدر تلفن همراه

رابط کاربری اپلیکیشن deepseek شباهت بسیاری به‌ نسخه‌ی وب آن دارد. پس از ورود به اپلیکیشن کادر ورود درخواست را همراه با گزینه‌هایی برای فعال کردن قابلیت‌های جست‌وجوی وب و DeepThink می‌بینید. آیکون باز کردن چت‌ جدید در گوشه‌ی بالا سمت راست رابط کاربری دیده می‌شود.

 

 

 

استفاده از هوش مصنوعی دیپ‌ سیک DeepSeek  در تلفن همراه

 

 

 

با کلیک کردن  آیکون + (کادر بنفش) می‌توانید به گزینه‌های پیوست تصویر و سند به دستور، دسترسی پیدا کنید. برای انتخاب تصویر از گالری گزینه‌ی Image OCR برای گرفتن تصویر با دوربین Photo OCR و برای انتخاب سند از فایل منیجر گوشی گزینه‌ی Document را بزنید.

تعامل با چت‌ها در هوش مصنوعی DeepSeek

هنگامی که درون یک چت اپلیکیشن deepseek هستید، با ضربه زدن و نگه‌داشتن روی دستور فرستاده شده به گزینه‌های کپی، انتخاب متن و ویرایش دستور دسترسی پیدا می‌کنید. با ضربه زدن و نگه داشتن روی پاسخ دیپ‌سیک، گزینه‌های کپی، انتخاب متن، بازتولید پاسخ، لایک و دیسلایک پاسخ و گزارش آن به‌نمایش در می‌آید.

 

 

 

 

هوش مصنوعی deepseek برای اندروید

 

 

 

 

 

تاریخچه‌ی چت‌ها در هوش مصنوعی DeepSeek

با ضربه روی آیکون مشخص‌شده گوشه‌ی بالا سمت چپ منوی جانبی تاریخچه‌ی چت‌ها به‌نمایش در می‌آید. برای باز کردن هر چت روی آن ضربه بزنید. با ضربه و نگه داشتن می‌توانید هر چت‌ را حذف یا نامش را تغییر دهید.

 

 

 

تاریخچه‌ی چت‌ها در هوش مصنوعی DeepSeek

 

 

 

 

تنظیمات پروفایل در هوش مصنوعی DeepSeek

در منوی تاریخچه‌ی چت‌ها‌ی اپلیکیشن دیپ سیک روی نام پروفایل خود ضربه بزنید. پس‌از باز شدن منوی تنظیمات می‌توانید تم اپلیکیشن و زبان را تغییر دهید. چت‌های خود را پاک‌ یا به‌طور کلی حسابتان را حذف کنید. خروج از اکانت نیز با گزینه‌ی Log out انجام می‌شود.

 

 

 

تنظیمات دیپ سیک

 

 

 

 

 

مقایسه‌ی عملکرد DeepSeek با ChatGPT!!

برای اینکه بفمیم دیپ‌سیک می‌تواند جایگزین چت جی پی تی باشد، به‌طور سطحی عملکرد مدل DeepSeek V3 از استارتاپ چینی را با عملکرد مدل GPT-4o از OpenAI در پاسخ به دستورات به زبان فارسی را بررسی کردیم. در چند مورد پاسخ‌های دیپ‌سیک با فعال بودن قابلیت DeepThink (که از مدل پیشرفته‌ی R1 استفاده می‌کند) نیز ارائه‌ شده است.

 

 

مقایسه‌ی عملکرد DeepSeek با ChatGPT!!

 

 

 

ChatGPT توسط OpenAI توسعه یافته و به علت انعطاف‌پذیری و مهارت‌های مکالمه قوی خود از محبوبیت زیادی برخوردار است، اما هوش مصنوعی به پیشرفت خود ادامه داده و مدل‌های جدیدتری مانند DeepSeek در حالت ارتقا سطح هستند. توجه داشته باشید DeepSeek دارای ویژگی‌های منحصر به فردی بوده که باعث شده بتوان آن را انتخاب بهتری برای بسیاری از کارها معرفی کرد. در این بخش به 5 دلیل برتری DeepSeek در مقایسه با ChatGPT اشاره خواهیم کرد.

 

  • ارائه سریع‌ پاسخ‌ها در دیپ سیک

یکی از دلایل برتری DeepSeek را باید سرعت بالای پاسخ‌دهی آن در مقایسه با ChatGPT دانست. شما در پاسخ‌دهی ChatGPT شاهد چند ثانیه مکث خواهید بود، اما پاسخ DeepSeek در همان لحظه اتفاق خواهد افتاد. این سرعت برای کارهایی که نیازمند پاسخ‌دهی لحظه‌ای هستند، می‌تواند استثنایی باشد که در میان آن‌ها می‌توان به پشتیبانی از مشتری‌ها و تحلیل‌های مالی اشاره کرد.

به عنوان مثال، پزشکان می‌توانند از DeepSeek در مراقبت‌های بهداشتی با هدف تجزیه و تحلیل سریع داده‌های بیمار و ارائه پیشنهادهای درمانی استفاده کنند. سرعت DeepSeek باعث صرفه‌جویی در زمان می‌شود، آن هم درست در شرایط اضطراری که می‌تواند ارزش بالای خود را نشان دهد.

در مقایسه DeepSeek با ChatGPT باید گفت سرعت مهم‌ترین عامل برتری به حساب می‌آید. از طرف دیگر طراحی هوشمند و الگوریتم‌های کارآمد DeepSeek به آن کمک می‌کند تا بتواند وظایف را بدون کاهش سرعت به سرانجام برساند.

  • درک بهتر DeepSeek نسبت به ChatGPT

شما باید بدانید DeepSeek می‌تواند درک مکالمه بهتری داشته باشد. جزئیات پیام‌های قبل را به خاطر آورده و این در حالی است که گاهی وقت‌ها ChatGPT اطلاعات را از دست داده یا در پاسخ به سوال‌های بعد، دچار مشکل می‌شود. به عنوان مثال، حقوق‌دان‌ها هنگام تحقیق نیازمند پاسخ‌های دقیق هستند.

هوش مصنوعی DeepSeek می‌تواند پرونده‌های حقوقی مرتبط با یکدیگر را متصل کرده و پیرامون آن‌ها، پاسخ‌های دقیق را ارائه کند. آموزش باکیفیت بالای DeepSeek به آن کمک کرده تا بتواند نتایج قابل اعتمادی در زمینه‌هایی مانند تحقیق‌های حقوقی و پشتیبانی فنی ارائه کند.

  • دیپ سیک برای صنایع مناسب تر است

هوش مصنوعی DeepSeek می‌تواند عملکرد بسیار خوبی از خود در بسیاری از صنایع نشان دهد. این هوش مصنوعی دارای ویژگی‌هایی ویژه برای بخش‌هایی مانند مراقبت‌های بهداشتی، مالی و آموزش و پرورش است. کسب و کارها می‌توانند به سادگی از آن برای پیشبرد اهداف خود استفاده کنند.

به عنوان مثال، DeepSeek می‌تواند برای ایجاد طرح‌های سفارشی درسی برای دانش‌آموزان، گزینه‌ای ایده‌آل به حساب آید. بانک‌ها می‌توانند از این هوش مصنوعی برای کشف تخلف‌های مالی در زمان واقعی استفاده کنند. هوش مصنوعی ChatGPT برای انجام کارهای ذکرشده نیازمند پلاگین یا کدنویسی اضافی بوده و این در حالی است که DeepSeek می‌تواند درک بهتری نسبت به وضعیت صنایع داشته باشد.

 

 

هوش مصنوعی دیپ سیک

 

 

  • رابط کاربری ساده و کاربرپسند DeepSeek

استفاده از هوش مصنوعی DeepSeek می‌تواند کار ساده‌ای برای کاربران به حساب آید. طراحی ساده با اعلان‌های هوشمند این هوش مصنوعی، توانسته باعث جلب توجه کاربران شود. البته باید گفت چت جی پی تی هم عملکرد خوبی دارد، اما معمولا نیازمند دستورالعمل‌های خاص بوده تا بتواند بهترین پاسخ‌ها را ارائه کند.

به عنوان مثال، یک بازاریاب می‌تواند از DeepSeek طرحی پیرامون یک رسانه اجتماعی را درخواست کند و خواهد دید که این هوش مصنوعی در سریع‌ترین زمان، یک استراتژی دقیق با هشتگ‌ها و ایده‌های پست را ارائه می‌کند. ChatGPT ممکن است برای اصلاح خروجی خود نیازمند پیگیری‌های بیشتری باشد. رابط کاربری ساده DeepSeek به راحتی برای افراد بدون دانش فنی می‌تواند ایده‌آل باشد.

  • مقرون به صرفه و مقیاس‌پذیر

DeepSeek هزینه کمتری در مقایسه با ChatGPT دارد. قیمت آن بر اساس استفاده تنظیم شده و همین مسئله توانسته آن را برای شغل‌های کوچک و بزرگ، مقرون به صرفه‌تر کند. در مقابل شاهد قیمت‌های بالایی از سوی ChatGPT هستیم.

یکی دیگر از نکات مهم که باید مدنظر قرار دهید، این است که DeepSeek از قدرت محاسباتی کمتری استفاده می‌کند و این مسئله در کاهش هزینه‌ها تاثیر دارد. کسب و کارهای کوچک می‌توانند DeepSeek را روی سرورهای اصلی اجرا کرده و وضعیت در چت جی پی تی نیازمند هزینه‌های نسبتا بالایی است؛ این انعطاف‌پذیری تضمین می‌کند که DeepSeek می‌تواند گزینه‌ای مقرون به صرفه و متناسب با بودجه کاربران باشد.

جمع‌بندی از مقایسه DeepSeek با Chat GPT

ابزارهای هوش مصنوعی می‌توانند روش کار، یادگیری و حل مشکلات را تغییر دهند. ChatGPT تاثیر زیادی گذاشت، اما DeepSeek همه چیز را ارتقا داد. سرعت بالای پاسخگویی DeepSeek در مقایسه با رقیب خود به همراه درک بهتر و سازگاری بالا با صنایع در کنار طراحی ساده و مقرون به صرفه بودن، باعث شده بتوان گفت DeepSeek به مراتب از ChatGPT می‌تواند کاربردی‌تر باشد. اینطور که پیداست، DeepSeek و ابزارهای مشابه مسیر پیشرفت و حرکت به سمت جلو را نشان می‌دهند و به نظر می‌رسد در آینده نه چندان دور شاهد مدل‌های جدید از هوش مصنوعی با کارایی بالاتر خواهیم بود.

 

 

مقایسه  DeepSeek  با Chat GPT

 

 

مزایا و معایب   هوش مصنوعی دیپ‌ سیک DeepSeek

اگر قصد استفاده از دیپ سیک را دارید و می‌خواهید آن را جایگرین چت بات‌های نامی کنید، بهتر است ابتدا نگاهی به مزایا و معایب دیپ‌ سیک و در ادامه مقایسه آن با چت جی پی تی داشته باشید.

مزایا DeepSeek :

  • مدل هوش مصنوعی پیشرفته: دیپ‌ سیک با استفاده از 671 میلیارد پارامتر، دقت بالایی در حل مسائل ریاضی، فیزیک، کدنویسی و تحلیل داده‌ها دارد و در برخی موارد دو برابر سریع‌تر از ChatGPT عمل می‌کند.
  • قابلیت DeepThink R1: این ویژگی با بهره‌گیری از مدل پیشرفته‌ی DeepSeek-R1، برای تجزیه‌وتحلیل عمیق مسائل پیچیده طراحی شده است؛ این قابلیت با استفاده از تکنیکی به‌نام استدلال زنجیره‌ای ( Chain Of Thought Reasoning)، پاسخ‌هایی دقیق و منطقی ارائه می‌دهد. برخلاف مدل o1 که در سایت چت جی پی تی رایگان نیست، استفاده از مدل R1 در دیپ‌سیک هزینه‌ای ندارد.
  • جست‌وجوی وب: امکان جست‌وجوی اینترنت برای ارائه پاسخ‌های به‌روز و مبتنی بر منابع آنلاین فراهم است. می‌توان دو قابلیت جست‌وجوی وب و DeepThink را برای پاسخ‌های دقیق‌تر ترکیب کرد.
  • سرعت عمل بالا: دیپ‌ سیک در شرایط عادی پاسخ‌ها را در ۷ تا ۱۰ ثانیه ارائه می‌دهد و به‌دلیل توان پردازشی بالا، می‌تواند ورودی‌هایی با طول ۱۲۸ هزار توکن را پردازش کند.
  • امکان آپلود و تحلیل فایل‌ها: کاربران می‌توانند فایل‌های متنی (مانند PDF) را آپلود کرده و پاسخ‌هایی مبتنی بر محتوای آن‌ها دریافت کنند.
  • دسترسی آزاد و رایگان برای کاربران ایرانی: برخلاف مدل‌های دیگر مانند ChatGPT و کلاود، دیپ‌ سیک بدون نیاز به VPN در ایران قابل دسترسی است.

معایب DeepSeek :

  • سانسور محتوا: دیپ‌ سیک 85 درصد از درخواست‌های مرتبط با موضوعات حساس چین (مانند اعتراضات میدان تیان‌آن‌من، وضعیت تایوان و تبت و نقض حقوق اویغورها) را با پاسخ‌های کلیشه‌ای و هماهنگ با سیاست‌های دولت چین رد می‌کند. بااین‌حال، مطالعات نشان داده است که محدودیت‌های آن به‌راحتی قابل دور زدن هستند و گاهی این چت‌بات پاسخ‌های ممنوعه را ارائه می‌کند؛ اما این پاسخ‌ها بلافاصله حذف شده یا جایگزین می‌شوند.
  • مشکلات پایداری: به‌دلیل استقبال گسترده، این چت‌بات در سرویس‌دهی دچار اختلال شده است. در زمان به‌روزرسانی این مقاله (بهمن 1403) هنگام استفاده از قابلیت Search و DeepThink-R1 به دفعات با پیغام دردسترس نبودن آن‌ها به‌دلیل شلوغی سرور‌ها مواجه شدیم.
  • خلاقیت پایین‌تر نسبت به رقبا: دیپ‌ سیک در تولید ایده‌های خلاقانه یا انجام وظایف تحقیقاتی پیچیده از مدل‌هایی مانند GPT-4o و Claude عقب‌تر است.
  • فقدان امکانات پیشرفته: برخلاف ابزارهایی مانند ChatGPT یا جمینای، دیپ‌ سیک قابلیت‌هایی مانند تولید تصاویر، مکالمه صوتی، یا استفاده از افزونه‌ها را ندارد.
  • عملکرد ضعیف در تشخیص متن از تصویر: در پردازش و استخراج متون از تصاویر، به‌ویژه در زبان‌های غیرانگلیسی مانند فارسی، دقت پایینی دارد.

نکته‌ی مهم در استفاده از نسخه‌های وب و موبایلی چت‌بات دیپ‌ سیک، خطرهای احتمالی حریم خصوصی مرتبط با آن است. بر اساس سیاست حفظ حریم خصوصی دیپ‌ سیک، این پلتفرم حق استفاده از ورودی‌ها و خروجی‌های کاربران را برای بهبود خدمات خود محفوظ می‌داند و هیچ مکانیزم روشنی برای انصراف از این فرایند وجود ندارد. هم‌چنین داده‌های کاربران در سرورهایی در چین ذخیره می‌شوند، جایی که قوانین حفاظت از داده‌ها متفاوت با کشورهای غربی است. خطرات یادشده محدود به دیپ‌ سیک نیستند؛ بسیاری از چت‌بات‌های هوش مصنوعی، مانند OpenAI و متا، داده‌های کاربران را برای آموزش مدل‌های خود استفاده می‌کنند، مگر اینکه کاربر صریحاً درخواست انصراف کند. بهتر است کاربران از اشتراک‌گذاری اطلاعات حساس با تمامی چت‌بات‌های هوش مصنوعی آنلاین، خودداری و در صورت امکان، مدل‌های متن‌باز (از جمله مدل‌های دیپ‌سیک) را روی سیستم‌های شخصی اجرا کنند.

 

 

 

هوش مصنوعی دیپ سیک

نظرات کاربران ( 0 نظر)
*نام و نام خانوادگی
* پست الکترونیک
* متن پیام

بستن
*نام و نام خانوادگی
* پست الکترونیک
* متن پیام

پرفروش ترین کالاها
+
_
پریز HDMI تک پورت
پریز دیواری HDMI | سوکت HDMI تو کار دیواری
پریز HDMI تک پورت
پریز دیواری HDMI | سوکت HDMI تو کار دیواری 0548,820 تومان مشاهده
+
_
MHL ام اچ ال
MHL کابل اتصال موبایل و تبلت به HDTV(مبدل MICRO USB به HDMI)
MHL ام اچ ال
MHL کابل اتصال موبایل و تبلت به HDTV(مبدل MICRO USB به HDMI) 0434,840 تومان مشاهده
+
_
RISER کارت کرافیک
رایزر گرافیک ۶ پین | تبدیل PCI-E 1x به 16x با کابل USB 3.0 | تبدیل RISER 16X
RISER کارت کرافیک
رایزر گرافیک ۶ پین | تبدیل PCI-E 1x به 16x با کابل USB 3.0 | تبدیل RISER 16X0245,970 تومان مشاهده
+
_
USB به RS232 OMEGA
کابل مبدل USB به سریال امگا |تبدیل یو اس بی به سریال
USB به RS232 OMEGA
کابل مبدل USB به سریال امگا |تبدیل یو اس بی به سریال01,712,830 تومان مشاهده
بستن
ورود به کاربریورود به کاربری
کد امنیتی :کد امنیتی
می خواهید ثبت نام کنید ؟
عضویت