Gemini Nano ที่มี Google AI Edge SDK

ในอุปกรณ์ Android ที่รองรับ คุณสามารถมอบประสบการณ์การใช้งาน Generative AI ที่สมบูรณ์แบบโดยไม่ต้องเชื่อมต่อเครือข่ายหรือส่งข้อมูลไปยังระบบคลาวด์ AI ในอุปกรณ์เป็นโซลูชันที่ยอดเยี่ยมสำหรับกรณีการใช้งานที่ความล่าช้าต่ำ ต้นทุนต่ำ และการคุ้มครองความเป็นส่วนตัวเป็นข้อกังวลหลัก

สำหรับกรณีการใช้งานในอุปกรณ์ คุณสามารถใช้โมเดลพื้นฐาน Gemini Nano ของ Google แม้ว่าจะเล็กกว่าโมเดล Gemini อื่นๆ ที่ทำงานเชิงอนุมานในระบบคลาวด์ แต่คุณปรับแต่ง Gemini Nano ให้ทำงานเฉพาะทางได้เช่นเดียวกับโมเดลที่ใหญ่กว่า Gemini Nano ทำงานในบริการระบบ AICore ของ Android ซึ่งใช้ประโยชน์จากฮาร์ดแวร์ของอุปกรณ์เพื่อลดเวลาในการตอบสนองของการอนุมานและทำให้โมเดลเป็นเวอร์ชันล่าสุดอยู่เสมอ

สิทธิ์เข้าถึง Gemini Nano API และ AICore มีให้โดย Google AI Edge SDK Google AI Edge คือชุดเครื่องมือที่ครอบคลุมสำหรับ ML ในอุปกรณ์ ดูข้อมูลเพิ่มเติมเกี่ยวกับ Google AI Edge

สถาปัตยกรรม

ในฐานะโมดูลระดับระบบ คุณจะเข้าถึง AICore ผ่านชุด API เพื่อเรียกใช้การอนุมานในอุปกรณ์ นอกจากนี้ AICore ยังมีฟีเจอร์ด้านความปลอดภัยในตัวหลายรายการ ซึ่งช่วยให้มั่นใจได้ว่าจะมีการประเมินอย่างละเอียดเทียบกับตัวกรองด้านความปลอดภัย แผนภาพต่อไปนี้แสดงวิธีที่แอปเข้าถึง AICore เพื่อเรียกใช้ Gemini Nano ในอุปกรณ์

Google AI Edge SDK, AICore และ Gemini Nano
รูปที่ 1 Google AI Edge SDK, AICore และ Gemini Nano

รักษาข้อมูลผู้ใช้ให้เป็นส่วนตัวและปลอดภัย

Generative AI ในอุปกรณ์จะเรียกใช้พรอมต์ในเครื่อง ซึ่งจะช่วยลดการเรียกใช้เซิร์ฟเวอร์ แนวทางนี้ช่วยเพิ่มความเป็นส่วนตัวโดยเก็บข้อมูลที่มีความละเอียดอ่อนไว้ในอุปกรณ์ เปิดใช้ฟังก์ชันการทำงานแบบออฟไลน์ และลดต้นทุนการอนุมาน

AICore เป็นไปตามหลักการของ Private Compute Core โดยมีลักษณะสำคัญต่อไปนี้

การเชื่อมโยงแพ็กเกจแบบจํากัด: AICore จะแยกจากแพ็กเกจอื่นๆ ส่วนใหญ่ โดยมีข้อยกเว้นที่จํากัดสําหรับแพ็กเกจระบบที่เฉพาะเจาะจง การแก้ไขรายการที่อนุญาตนี้จะเกิดขึ้นได้ในระหว่างการอัปเดต OTA ของ Android แบบสมบูรณ์เท่านั้น

การเข้าถึงอินเทอร์เน็ตโดยอ้อม: AICore ไม่มีสิทธิ์เข้าถึงอินเทอร์เน็ตโดยตรง คำขอทั้งหมดทางอินเทอร์เน็ต รวมถึงการดาวน์โหลดโมเดลจะส่งผ่าน APK ของPrivate Compute Services ที่ทำงานร่วมกันแบบโอเพนซอร์ส API ภายในบริการประมวลผลข้อมูลส่วนตัวต้องแสดงให้เห็นอย่างชัดเจนว่ามุ่งเน้นความเป็นส่วนตัว

นอกจากนี้ AICore ยังสร้างขึ้นเพื่อแยกคำขอแต่ละรายการและไม่จัดเก็บระเบียนข้อมูลอินพุตหรือเอาต์พุตที่ได้หลังจากประมวลผลเพื่อปกป้องความเป็นส่วนตัวของผู้ใช้ อ่านข้อมูลเพิ่มเติมได้ในบล็อกโพสต์ข้อมูลเบื้องต้นเกี่ยวกับความเป็นส่วนตัวและความปลอดภัยสำหรับ Gemini Nano

ภาพประกอบสถาปัตยกรรม AICore
รูปที่ 2 สถาปัตยกรรม AICore

ประโยชน์ของการเข้าถึงโมเดลพื้นฐาน AI ด้วย AICore

AICore ช่วยให้ระบบปฏิบัติการ Android ให้บริการและจัดการโมเดลพื้นฐาน AI ได้ ซึ่งจะช่วยลดต้นทุนในการใช้โมเดลขนาดใหญ่เหล่านี้ในแอปได้อย่างมาก โดยสาเหตุหลักๆ มีดังนี้

การติดตั้งใช้งานที่ง่ายดาย: AICore จะจัดการการเผยแพร่ Gemini Nano และจัดการการอัปเดตในอนาคต คุณจึงไม่ต้องกังวลเกี่ยวกับการดาวน์โหลดหรืออัปเดตโมเดลขนาดใหญ่ผ่านเครือข่าย รวมถึงไม่ส่งผลต่องบประมาณหน่วยความจำของดิสก์และรันไทม์ของแอป

การอนุมานที่เร็วขึ้น: AICore ใช้ประโยชน์จากฮาร์ดแวร์ในอุปกรณ์เพื่อเร่งการอนุมาน แอปของคุณจะมีประสิทธิภาพดีที่สุดในอุปกรณ์แต่ละเครื่อง และคุณไม่จําเป็นต้องกังวลเกี่ยวกับอินเทอร์เฟซฮาร์ดแวร์พื้นฐาน

ฟังก์ชันที่รองรับ

  • อุปกรณ์ที่รองรับ: ปัจจุบัน Gemini Nano ที่มี Google AI Edge SDK พร้อมให้ทดลองใช้ในอุปกรณ์ Pixel 9 Series
  • รูปแบบที่รองรับ: ปัจจุบัน AICore รองรับรูปแบบข้อความสำหรับ Gemini Nano

การรองรับอุปกรณ์และรูปแบบเพิ่มเติมเป็นพื้นที่ที่เราลงทุนอย่างต่อเนื่อง

กรณีการใช้งาน

โมเดล Generative AI ในอุปกรณ์ได้รับการออกแบบโดยเน้นที่ประสิทธิภาพและขนาด เนื่องจากมีข้อจำกัดด้านทรัพยากรของอุปกรณ์เคลื่อนที่เมื่อเทียบกับเซิร์ฟเวอร์ระบบคลาวด์ การเพิ่มประสิทธิภาพนี้จะให้ความสำคัญกับงานที่เจาะจงและกำหนดไว้อย่างชัดเจนมากกว่าแอปพลิเคชันทั่วไป กรณีการใช้งานที่เหมาะสม ได้แก่

  • การปรับแก้ข้อความ: แก้ไขระดับภาษาและรูปแบบของข้อความ (เช่น จากภาษาที่เป็นกันเองเป็นทางการ)
  • ช่วยตอบ: สร้างคำตอบที่เกี่ยวข้องกับบริบทภายในชุดข้อความแชท
  • การพิสูจน์อักษร: ระบุและแก้ไขข้อผิดพลาดด้านการสะกดคำและไวยากรณ์
  • การสรุป: ย่อเอกสารที่มีความยาวเป็นสรุปที่กระชับ (ย่อหน้าหรือหัวข้อย่อย)

ดูเอกสารประกอบเกี่ยวกับกลยุทธ์พรอมต์เพื่อให้ได้ประสิทธิภาพสูงสุด หากต้องการสำรวจกรณีการใช้งานเหล่านี้ด้วยตนเอง ให้ดาวน์โหลดแอปตัวอย่างของเราและเริ่มทดสอบด้วย Gemini Nano

แอป Google หลายแอปใช้ Gemini Nano ตัวอย่างเช่น

  • Talkback: แอปการช่วยเหลือพิเศษของ Android อย่าง Talkback ใช้ประโยชน์จากความสามารถของอินพุตแบบหลายรูปแบบของ Gemini ในการปรับปรุงคำอธิบายรูปภาพสำหรับผู้ใช้ที่มีความบกพร่องทางสายตา
  • โปรแกรมอัดเสียงของ Pixel: แอปโปรแกรมอัดเสียงของ Pixel ใช้ Gemini Nano และ AICore เพื่อขับเคลื่อนฟีเจอร์การสรุปในอุปกรณ์ ทีมโปรแกรมอัดเสียงได้นำโมเดล Gemini Nano ล่าสุดมาใช้เพื่อรองรับไฟล์บันทึกเสียงที่ยาวขึ้นและส่งสรุปที่มีคุณภาพสูงขึ้น
  • Gboard: ฟีเจอร์ช่วยตอบของ Gboard ใช้ประโยชน์จาก Gemini Nano ในอุปกรณ์ร่วมกับ AICore เพื่อให้คำตอบที่ถูกต้อง