Vision AI Intelligence BETA
Görsellerinizi ve PDF dosyalarınızı sadece okumakla kalmayın, onları anlamlandırın. Vision AI API, dökümanlarınızdaki karmaşık verileri saniyeler içinde yapılandırılmış JSON formatına dönüştürür.
PDF Desteği Şimdi Aktif!
Artık sadece resim değil, çok sayfalı PDF dosyalarınızı da doğrudan analiz edebilir ve içindeki verileri tek bir istekte ayıklayabilirsiniz.
- Multimodal Mimari: Görüntü, metin ve döküman hiyerarşisini aynı anda analiz edebilen hibrit motor.
- 1M+ Token Bağlam Penceresi: Binlerce sayfalık karmaşık dökümanları ve teknik tabloları bütünsel olarak kavrama gücü.
- Sürücü Belgesi & Pasaport: Kimlik dökümanlarından biyometrik ve metinsel veri tespiti.
- Anlamsal Veri Çıkarımı: Veriyi sadece okumaz, alanlar arasındaki ilişkileri (Örn: Vergi No -> Şirket Ünvanı) mantıksal olarak bağlar.
curl -X POST \
"https://api.scaefy.com/api/v1/vision/extract" \
-H "Authorization: Bearer YOUR_TOKEN" \
-H "Accept: application/json" \
-F "[email protected]" \
-F "prompt=Extract table data into JSON"
$response = Http::withToken('YOUR_TOKEN')
->attach('image_file', file_get_contents($path), 'invoice.pdf')
->post('https://api.scaefy.com/api/v1/vision/extract', [
'prompt' => 'Extract items and totals'
]);
$data = $response->json();
{
"status": "success",
"data": {
"type": "invoice",
"invoice_no": "INV-2026-001",
"grand_total": 1250.50,
"currency": "TRY",
"vendor": "Teknoloji Market A.Ş.",
"tax_detail": { "vat_20": 208.42 }
}
}
Kullanılabilir Uç Noktalar (Endpoints)
| Metot | Endpoint | Açıklama |
|---|---|---|
| POST | /api/v1/vision/extract | Fatura, pasaport ve PDF dökümanlarından yapılandırılmış veri ayıklar. |
| POST | /api/v1/vision/ocr | Görsel üzerindeki tüm metinleri ham veri olarak dijital yazıya çevirir. |
| POST | /api/v1/vision/face-detect | Görseldeki yüzleri tespit eder ve temel demografik verileri döner. |
Vision AI ile Neler Yapabilirsiniz?
Özel Prompting Özelliği
Siz sadece bir döküman göndermiyorsunuz, yapay zekaya o dökümandan ne beklediğinizi de söylüyorsunuz. "Prompt" parametresi ile analiz kapsamını özelleştirebilirsiniz.
Sıkça Sorulan Sorular
Türkçe destekliyor mu?
Evet, Türkçe karakterleri ve döküman yapılarını (Örn: Türk vergi levhaları, kimlikleri vb.) %99.9 doğrulukla tanır. Ayrıca 100'den fazla dili desteklemektedir.
İşleme hızı ne kadar?
Standart görseller genellikle 1-2 saniye, çok sayfalı PDF'ler ise sayfa sayısına bağlı olarak 3-5 saniye arasında JSON çıktısı üretir.
Çoklu döküman desteği var mı?
Tek bir görsel içinde yan yana duran iki farklı kartviziti veya faturayı algılayabilir ve bunları ayrı nesneler olarak JSON içinde gruplayabilir.
JSON dışında format döner mi?
API tasarımımız standart JSON üzerine kuruludur. Ancak `prompt` ile isterseniz CSV veya Markdown formatında metin çıktısı da talep edebilirsiniz.
Dosya boyutu limiti nedir?
Maksimum dosya boyutu 10MB'dır. Bu limit hem Base64 gönderimleri hem de dosya yüklemeleri için geçerlidir.
Ücretlendirme nasıl yapılır?
Başarılı şekilde sonuçlanan her "extract" isteği başına 1 kredi düşülür. Hatalı veya okunamayan dökümanlar için kredi düşülmez.
Standart OCR'dan farkı nedir?
OCR sadece harfleri tanır, Vision Intelligence ise içeriği anlar. Örneğin bir sayı gördüğünde onun "Ara Toplam" mı yoksa "KDV" mi olduğunu bilir.
Entegrasyon desteği veriyor musunuz?
Kesinlikle. Dokümantasyon sayfamızdaki örneklerin yanı sıra, teknik ekibimizle Discord veya e-posta üzerinden iletişime geçebilirsiniz.