تتيح واجهة برمجة التطبيقات Gemini API إدخال ملفات PDF، بما في ذلك المستندات الطويلة (حتى 1, 000 صفحة). تعالج نماذج Gemini ملفات PDF باستخدام ميزة الرؤية الأصلية، وبالتالي يمكنها فهم محتوى النصوص والصور داخل المستندات. من خلال إتاحة ميزة "الرؤية" لتنسيق PDF بشكلٍ أصلي، يمكن لنماذج Gemini إجراء ما يلي:
- تحليل المخططات البيانية والرسومات البيانية والجداول داخل المستندات
- استخراج المعلومات إلى تنسيقات نتائج منظَّمة
- الإجابة عن أسئلة حول المحتوى المرئي والنصوص في المستندات
- تلخيص المستندات
- تحويل محتوى المستند إلى نص (مثلاً إلى HTML) مع الحفاظ على التنسيقات والتنسيقات، وذلك لاستخدامها في التطبيقات المعنيّة
يوضّح هذا البرنامج التعليمي بعض الطرق المحتمَلة لاستخدام Gemini API لمعالجة مستندات ملف PDF.
التفاصيل الفنية
يمكن استخدام 1,000 صفحة مستند كحد أقصى في Gemini. يجب أن تكون صفحات المستند بأحد أنواع MIME التالية للبيانات النصية:
- ملف PDF -
application/pdf
- JavaScript -
application/x-javascript
،text/javascript
- Python -
application/x-python
،text/x-python
- TXT -
text/plain
- HTML -
text/html
- CSS -
text/css
- Markdown -
text/md
- ملف CSV -
text/csv
- XML -
text/xml
- RTF -
text/rtf
تعادل كل صفحة من صفحات المستند 258 رمزًا.
على الرغم من عدم وجود حدود محدّدة لعدد البكسل في المستند باستثناء نافذة سياق النموذج، يتم تصغير الصفحات الأكبر حجمًا إلى الحد الأقصى من الدقة الذي يبلغ 3072×3072 مع الحفاظ على نسبة العرض إلى الارتفاع الأصلية، في حين يتم تكبير الصفحات الأصغر حجمًا إلى 768×768 بكسل. لا يتمّ تخفيض التكلفة للصفحات ذات الحجم المنخفض، باستثناء عرض النطاق، ولا يتمّ تحسين الأداء للصفحات ذات الدقة العالية.
للحصول على أفضل النتائج:
- يجب تدوير الصفحات إلى الاتجاه الصحيح قبل تحميلها.
- تجنَّب الصفحات المموّهة.
- في حال استخدام صفحة واحدة، ضَع الطلب النصي بعد الصفحة.
الخطوات التالية
لمزيد من المعلومات، يُرجى الاطّلاع على المراجع التالية:
- استراتيجيات طلب الملفات: تتيح واجهة برمجة التطبيقات Gemini API طلب البيانات النصية والمرئية والمسموعة والمرئية، والتي تُعرف أيضًا باسم طلبات البيانات المتعددة الوسائط.
- تعليمات النظام: تتيح لك تعليمات النظام توجيه سلوك النموذج استنادًا إلى احتياجاتك وحالات الاستخدام المحدّدة.