مقاله

مایکروسافت با مدل MAI-Image-1 وارد دنیای هوش مصنوعی تصویرسازی شد.

مایکروسافت رسماً از مدل جدید خود با نام MAI-Image-1 رونمایی کرد؛ مدلی که برای تبدیل متن به تصویر طراحی شده و به گفته این شرکت، اولین مدل تصویرسازی «درون‌سازمانی» آن است. این مدل هم‌اکنون در ابزارهایی مانند Bing Image Creator و Copilot در دسترس قرار گرفته است.

ورود مایکروسافت به میدان رقابت مدل‌های تصویرساز

تا امروز مایکروسافت برای تولید تصویر از مدل‌های شرکت‌های دیگر مثل OpenAI استفاده می‌کرد، اما با معرفی MAI-Image-1، مسیر جدیدی را آغاز کرده که نشان از استقلال و جاه‌طلبی این غول نرم‌افزاری در حوزه هوش مصنوعی دارد.
بر اساس گزارش The Verge، این مدل از پایه در داخل مایکروسافت توسعه یافته و تمرکز آن روی کیفیت رنگ، جزئیات تصویری و ترکیب خلاقانه اشیاء در محیط‌های طبیعی و شهری است.

ویژگی‌های کلیدی مدل MAI-Image-1

  • درک زبانی بهبود‌یافته: مدل می‌تواند توصیف‌های متنی پیچیده را به عناصر بصری دقیق تبدیل کند.
  • تولید سریع‌تر از مدل‌های نسل قبل: مایکروسافت ادعا کرده سرعت پردازش تصاویر تا ۴۰٪ افزایش یافته است.
  • یکپارچگی با Copilot و Bing: کاربران می‌توانند مستقیماً از طریق Copilot در ویندوز یا مرورگر Edge، تصویرسازی کنند.
  • پشتیبانی از حالت “Audio Expressions”: در نسخه‌های آینده، کاربران حتی می‌توانند با توصیف صوتی تصویر بسازند.

محدودیت‌های فعلی

در حال حاضر، MAI-Image-1 بیشتر برای تصاویر طبیعی، غذا، مناظر و سوژه‌های هنری بهینه شده است. برخی کاربران اروپایی گزارش داده‌اند که هنوز به‌صورت کامل به مدل دسترسی ندارند. همچنین، مدل فعلاً در پلتفرم‌های غیرمایکروسافتی مثل Discord یا API عمومی عرضه نشده است.

چرا این خبر مهم است؟

ورود مایکروسافت به توسعه مدل‌های تصویرسازی داخلی، یک نقطه عطف مهم در رقابت میان غول‌های فناوری است. این اقدام نشان می‌دهد که شرکت دیگر نمی‌خواهد تنها شریک OpenAI باشد، بلکه می‌خواهد مستقیماً در این حوزه سهم بگیرد.
از منظر بازار، MAI-Image-1 می‌تواند جایگاه مایکروسافت را در رقابت با Midjourney، DALL-E 3 و Stable Diffusion XL تثبیت کند.

نتیجه‌گیری

مدل MAI-Image-1 گام بزرگی برای مایکروسافت است تا از مصرف‌کننده به تولیدکننده مدل‌های هوش مصنوعی تبدیل شود. اگر این مسیر ادامه پیدا کند، در آینده نزدیک شاهد ترکیب قابلیت‌های تصویرسازی و ویرایش ویدیو در محیط ویندوز و Copilot خواهیم بود — چیزی که می‌تواند تجربه کاربری را به‌کلی متحول کند.

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *