ইমেজেন (টেক্সট-টু-ইমেজ মডেল)
সূৰ্যাস্তৰ সময়ত জিলিকি থকা নদীৰ পাৰত মেখেলা চাদৰ পৰিধান কৰা অসমীয়া লোককথাৰ নায়িকা তেজীমলা, কৃত্ৰিম বুদ্ধিমত্তাৰ দ্বাৰা নিৰ্মিত। | |
| বিকাশক | গুগল ডিপমাইণ্ড |
|---|---|
| প্ৰথম মুক্তি | মে' ২০২২ |
| স্থিৰ মুক্তি | ইমেজেন ৪ / ২০ মে' ২০২৫ |
| প্ৰকাৰ | টেক্সট-টু-ইমেজ মডেল |
| ৱেবছাইট | ইমেজেন ৱেবছাইট |
ইমেজেন হৈছে গুগল ডিপমাইণ্ডদ্বাৰা বিকশিত টেক্সট-টু-ইমেজ মডেলসমূহৰ এটা শৃংখল। ২০২৩ এপ্ৰিলত ডিপমাইণ্ডৰ সৈতে একত্ৰীকৰণ হোৱাৰ আগলৈকে ইয়াক গুগল ব্ৰেইনৰদ্বাৰা বিকশিত কৰা হৈছিল।[1] ইমেজেনৰ প্ৰধান ব্যৱহাৰ হৈছে টেক্সট প্ৰম্প্টৰপৰা ছবি সৃষ্টি কৰা, যি Stability AI-ৰ ষ্টেবল ডিফিউজন, OpenAI-ৰ DALL-E, বা মিডজাৰ্নিৰ দৰে। এই মডেলটোৰ মূল সংস্কৰণ প্ৰথমে ২০২২ চনৰ মে’ মাহত প্ৰকাশিত এখন বৈজ্ঞানিক প্ৰবন্ধত আলোচনা কৰা হৈছিল।[2] এই সঁজুলিয়ে উচ্চ-মানৰ ছবি সৃষ্টি কৰে আৰু গুগল একাউণ্ট থকা সকলো ব্যৱহাৰকাৰীৰ বাবে জিমিনি (চাটবট), ImageFX, আৰু Vertex AI-ৰ জৰিয়তে উপলব্ধ হয়।[3]
ইতিহাস
[সম্পাদনা কৰক]ইমেজেনৰ প্ৰথম সংস্কৰণ ২০২২ চনৰ মে’ মাহত প্ৰকাশিত এটা প্ৰবন্ধত পেশ কৰা হৈছিল। ইয়াত প্ৰাকৃতিক ভাষাৰপৰা উচ্চ-মানৰ ছবি সৃষ্টি কৰাৰ ক্ষমতা আছিল।[2] দ্বিতীয় সংস্কৰণ ইমেজেন ২ ২০২৩ চনৰ ডিচেম্বৰত মুক্তি পায়।[4] ইয়াৰ বিশেষ বৈশিষ্ট্য আছিল টেক্সট আৰু লোগো সৃষ্টি।[5] ইমেজেন ৩ ২০২৪ চনৰ আগষ্টত মুক্তি পায়।[6] গুগলে দাবী কৰিছিল যে নতুন সংস্কৰণত ছবিৰ বিস্তাৰিত আৰু আলোকৰ মান উন্নত কৰা হৈছে।[7] ২০২৫ চনৰ ২০ মে’ তাৰিখে Google I/O 2025-ত ইমেজেন ৪ মুক্তি পায়।[8]
প্ৰযুক্তি
[সম্পাদনা কৰক]ইমেজেনে দুটা মুখ্য প্ৰযুক্তি ব্যৱহাৰ কৰে। প্ৰথমটো হৈছে ট্ৰান্সফৰ্মাৰ-ভিত্তিক বৃহৎ ভাষা মডেল, বিশেষকৈ T5, যাৰদ্বাৰা টেক্সট বুজি লয় আৰু ইমেজ সংশ্লেষণৰ বাবে এনক’ড কৰে। দ্বিতীয়টো হৈছে স্তৰভিত্তিক ডিফিউজন মডেল, যাৰদ্বাৰা উচ্চ-মানৰ ছবি সৃষ্টি হয়। ই তিনিটা পৰ্যায়ত ছবি সৃষ্টি কৰে: প্ৰথমে 64x64, তাৰপাছত 256x256 আৰু শেষত 1024x1024লৈ আপস্কেল কৰা হয়।[2]
ক্ষমতা
[সম্পাদনা কৰক]ইমেজেনে টেক্সট প্ৰম্প্টৰপৰা ফটো-বাস্তৱ ছবি সৃষ্টি কৰিব পাৰে।[3] ই বিভিন্ন ধৰণৰ শৈলী সৃষ্টি কৰিব পাৰে, যেনে সিনেমাটিক, 35mm ফিল্ম, ইলাষ্ট্ৰেচন, আৰু সুৰ্ৰিয়েল। আন টেক্সট-টু-ইমেজ মডেলৰ দৰে য়ো মানুহৰ আঙুলি, লিখনী, এম্বিগ্ৰাম আৰু টাইপোগ্ৰাফীৰ ক্ষেত্ৰত অসুবিধা ভোগে।
মডেলটোৱে পাঁচটা অনুপাতত ছবি সৃষ্টি কৰিব পাৰে: 9:16, 3:4, 1:1, 4:3, আৰু 16:9। লগতে, ই আগতে সৃষ্টি কৰা ছবিসমূহ প্ৰম্প্ট সম্পাদনা কৰি পুনৰ উন্নত কৰিবও পাৰে।[7]
তথ্যসূত্ৰ
[সম্পাদনা কৰক]- ↑ Roth, Emma; Peters, Jay (April 20, 2023). "Google's big AI push will combine Brain and DeepMind into one team". The Verge. https://www.theverge.com/2023/4/20/23691468/google-ai-deepmind-brain-merger। আহৰণ কৰা হৈছে: March 18, 2025.
- ↑ 2.0 2.1 2.2 Saharia, Chitwan; Chan, William; Saxena, Saurabh; Li, Lala; Whang, Jay; Denton, Emily; Seyed Kamyar Seyed Ghasemipour; Burcu Karagol Ayan; Sara Mahdavi, S.; Rapha Gontijo Lopes; Salimans, Tim; Ho, Jonathan; David J Fleet; Norouzi, Mohammad (2022). "Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding". arXiv:2205.11487
[cs.CV].
- ↑ 3.0 3.1 Peterson, Jake (2024-08-16). "Anyone With a Google Account Can Try Google's Latest AI Image Generator Right Now" (en ভাষাত). Lifehacker. https://lifehacker.com/tech/you-can-try-googles-latest-ai-image-generator-right-now। আহৰণ কৰা হৈছে: 2025-03-18.
- ↑ "Imagen 2 - our most advanced text-to-image technology" (en ভাষাত). Google DeepMind. 2025-03-12. https://deepmind.google/technologies/imagen-2/। আহৰণ কৰা হৈছে: 2025-03-18.
- ↑ Wiggers, Kyle (2023-12-13). "Google debuts Imagen 2 with text and logo generation" (en-US ভাষাত). TechCrunch. https://techcrunch.com/2023/12/13/google-debuts-imagen-2-with-text-and-logo-generation/। আহৰণ কৰা হৈছে: 2025-03-18.
- ↑ Schoon, Ben (2024-08-16). "Google opens access to Imagen 3, its latest model for AI image generation" (en-US ভাষাত). 9to5Google. https://9to5google.com/2024/08/16/google-imagen-3-launch/.
- ↑ 7.0 7.1 "Some of the most realistic AI images you'll see were created with this free tool" (en ভাষাত). TechRadar. 2025-02-26. https://www.techradar.com/computing/artificial-intelligence/what-is-imagen-3-everything-you-need-to-know-about-googles-text-to-image-model। আহৰণ কৰা হৈছে: 2025-03-18.
- ↑ "Imagen 4 is Google’s newest AI image generator" (en ভাষাত). techcrunch.com. 2025-05-20. https://techcrunch.com/2025/05/20/imagen-4-is-googles-newest-ai-image-generator/। আহৰণ কৰা হৈছে: 2025-03-18.
