POST /api/v1/vision/extract

Vision AI Intelligence BETA

Görsellerinizi ve PDF dosyalarınızı sadece okumakla kalmayın, onları anlamlandırın. Vision AI API, dökümanlarınızdaki karmaşık verileri saniyeler içinde yapılandırılmış JSON formatına dönüştürür.

PDF Desteği Şimdi Aktif!

Artık sadece resim değil, çok sayfalı PDF dosyalarınızı da doğrudan analiz edebilir ve içindeki verileri tek bir istekte ayıklayabilirsiniz.

Multimodal Mimari: Görüntü, metin ve döküman hiyerarşisini aynı anda analiz edebilen hibrit motor.
1M+ Token Bağlam Penceresi: Binlerce sayfalık karmaşık dökümanları ve teknik tabloları bütünsel olarak kavrama gücü.
Sürücü Belgesi & Pasaport: Kimlik dökümanlarından biyometrik ve metinsel veri tespiti.
Anlamsal Veri Çıkarımı: Veriyi sadece okumaz, alanlar arasındaki ilişkileri (Örn: Vergi No -> Şirket Ünvanı) mantıksal olarak bağlar.

Hemen Başla Dokümantasyon

curl -X POST \
      "https://api.scaefy.com/api/v1/vision/extract" \
      -H "Authorization: Bearer YOUR_TOKEN" \
      -H "Accept: application/json" \
      -F "[email protected]" \
      -F "prompt=Extract table data into JSON"

$response = Http::withToken('YOUR_TOKEN')
        ->attach('image_file', file_get_contents($path), 'invoice.pdf')
        ->post('https://api.scaefy.com/api/v1/vision/extract', [
            'prompt' => 'Extract items and totals'
        ]);
        
    $data = $response->json();

{
  "status": "success",
  "data": {
    "type": "invoice",
    "invoice_no": "INV-2026-001",
    "grand_total": 1250.50,
    "currency": "TRY",
    "vendor": "Teknoloji Market A.Ş.",
    "tax_detail": { "vat_20": 208.42 }
  }
}

< 2.5s

Ortalama İşleme Hızı

%99.2

Karakter Doğruluğu

Kullanılabilir Uç Noktalar (Endpoints)

Metot	Endpoint	Açıklama
POST	/api/v1/vision/extract	Fatura, pasaport ve PDF dökümanlarından yapılandırılmış veri ayıklar.
POST	/api/v1/vision/ocr	Görsel üzerindeki tüm metinleri ham veri olarak dijital yazıya çevirir.
POST	/api/v1/vision/face-detect	Görseldeki yüzleri tespit eder ve temel demografik verileri döner.

Vision AI ile Neler Yapabilirsiniz?

MUHASEBE

Otomatik Fatura Girişi

Gelen faturaları manuel girmek yerine API\'mize gönderin. Tarih, tutar, vergi numarası ve kalemleri anında veritabanınıza eşitleyin.

KDV ayrıştırma
IBAN tanıma

LOJİSTİK

Konşimento ve Etiket Okuma

Paket üzerindeki barkod altı metinleri, adresleri ve teslimat notlarını ayrıştırarak lojistik süreçlerinizi dijitalleştirin.

Adres doğrulama
Teslimat notu analizi

KİMLİK

KYC ve Kimlik Doğrulama

Müşteri kayıt süreçlerinde (KYC) sürücü belgesi, kimlik veya pasaport üzerindeki bilgileri otomatik olarak çekerek kullanıcı hatasını sıfıra indirin.

Ad-Soyad ayrıştırma
Seri no tespiti

PERAKENDE

Menü ve Katalog Analizi

E-ticaret veya yemek siparişi platformları için basılı menüleri veya ürün kataloglarını saniyeler içinde dijital envantere dönüştürün.

Fiyat listesi çıkarma
Ürün gruplandırma

EMLAK & HUKUK

Sözleşme ve Tapu Tarama

Kira sözleşmeleri, tapular veya yasal dökümanlardaki isim, adres, tutar ve özel şartları ayıklayarak arşivleme süreçlerinizi hızlandırın.

Madde analizi
Taraf bilgileri ayıklama

SAĞLIK

Reçete ve Rapor Yönetimi

Laboratuvar sonuçları, ilaç reçeteleri veya taburcu raporlarından verileri çekerek dijital sağlık kayıtlarınızı otomatik olarak güncelleyin.

Test sonuçları takibi
İlaç adı ve dozaj tespiti

Özel Prompting Özelliği

Siz sadece bir döküman göndermiyorsunuz, yapay zekaya o dökümandan ne beklediğinizi de söylüyorsunuz. "Prompt" parametresi ile analiz kapsamını özelleştirebilirsiniz.

                        "Sadece fatura kalemlerini tablo halinde getir ve her kalemin KDV oranını ayrı bir field olarak ekle."
                    

READY FOR PROD

Sıkça Sorulan Sorular

Türkçe destekliyor mu?

Evet, Türkçe karakterleri ve döküman yapılarını (Örn: Türk vergi levhaları, kimlikleri vb.) %99.9 doğrulukla tanır. Ayrıca 100'den fazla dili desteklemektedir.

İşleme hızı ne kadar?

Standart görseller genellikle 1-2 saniye, çok sayfalı PDF'ler ise sayfa sayısına bağlı olarak 3-5 saniye arasında JSON çıktısı üretir.

Çoklu döküman desteği var mı?

Tek bir görsel içinde yan yana duran iki farklı kartviziti veya faturayı algılayabilir ve bunları ayrı nesneler olarak JSON içinde gruplayabilir.

JSON dışında format döner mi?

API tasarımımız standart JSON üzerine kuruludur. Ancak `prompt` ile isterseniz CSV veya Markdown formatında metin çıktısı da talep edebilirsiniz.

Dosya boyutu limiti nedir?

Maksimum dosya boyutu 10MB'dır. Bu limit hem Base64 gönderimleri hem de dosya yüklemeleri için geçerlidir.

Ücretlendirme nasıl yapılır?

Başarılı şekilde sonuçlanan her "extract" isteği başına 1 kredi düşülür. Hatalı veya okunamayan dökümanlar için kredi düşülmez.

Standart OCR'dan farkı nedir?

OCR sadece harfleri tanır, Vision Intelligence ise içeriği anlar. Örneğin bir sayı gördüğünde onun "Ara Toplam" mı yoksa "KDV" mi olduğunu bilir.

Entegrasyon desteği veriyor musunuz?

Kesinlikle. Dokümantasyon sayfamızdaki örneklerin yanı sıra, teknik ekibimizle Discord veya e-posta üzerinden iletişime geçebilirsiniz.