MİRAS, Osmanlıca metinleri modern Türkçeye çeviren ve öğrenme deneyimi sunan kapsamlı bir AI platformudur. Duolingo benzeri interaktif öğrenme arayüzü ile Osmanlıca öğrenmeyi kolaylaştırır.
- 🔍 Gelişmiş OCR Sistemi: Tesseract, PaddleOCR ve özel modeller ile yüksek doğruluk
- 🌐 Çok Dilli Çeviri: Osmanlıca → Türkçe çeviri sistemi
- 📚 İnteraktif Öğrenme: Duolingo tarzı yol haritası ve dersler
- 🎯 Kişiselleştirilmiş Deneyim: İlerleme takibi ve adaptif öğrenme
- 📱 Modern Arayüz: Responsive tasarım ve kullanıcı dostu UI
- 🔧 Açık Kaynak: Tüm bileşenler açık kaynak ve ticari kullanıma uygun
- Next.js 15.3.5 - React framework
- React 19.0.0 - UI kütüphanesi
- TypeScript 5.0 - Tip güvenliği
- Tailwind CSS 3.4.0 - Styling
- Radix UI - Erişilebilir UI bileşenleri
- Framer Motion - Animasyonlar
- Zustand - State management
- Python - AI/ML işlemleri
- Tesseract OCR - Metin tanıma
- PaddleOCR - Gelişmiş OCR
- OpenCV - Görüntü işleme
- NumPy/SciPy - Bilimsel hesaplamalar
- Scikit-learn - Makine öğrenmesi
- Hybrid OCR System: Tesseract + PaddleOCR + Custom Models
- Advanced Image Processing: CLAHE, Otsu thresholding, morphological operations
- Character Segmentation: Connected component analysis, DBSCAN clustering
- Text Post-processing: Arabic text normalization, grammar rules
- Translation Engine: Mapping-based translation with 1800+ word pairs
- Node.js 18+
- Python 3.8+
- Tesseract OCR
- Git
git clone <repository-url>
cd yenidenemenpm installcd ai-training
python -m venv .venv
source .venv/bin/activate # Linux/Mac
# veya
.venv\Scripts\activate # Windowspip install -r requirements.txt# Chocolatey ile
choco install tesseract
# veya manuel kurulum
# https://github.com/UB-Mannheim/tesseract/wikibrew install tesseractsudo apt-get install tesseract-ocr
sudo apt-get install tesseract-ocr-ara # Arapça desteği# Terminal 1: Frontend
npm run dev
# Terminal 2: Backend (gerekirse)
cd ai-training
python tesseract_ottoman_ocr.pyyenideneme/
├── src/ # Frontend kaynak kodları
│ ├── app/ # Next.js App Router
│ │ ├── api/ # API routes
│ │ │ ├── ocr-translate/ # OCR ve çeviri API
│ │ │ ├── text-translate/ # Metin çeviri API
│ │ │ └── analyze-image/ # Görüntü analiz API
│ │ ├── image-translation/ # Görüntü çeviri sayfası
│ │ ├── text-translation/ # Metin çeviri sayfası
│ │ └── roadmap/ # Öğrenme yol haritası
│ ├── components/ # React bileşenleri
│ ├── lib/ # Yardımcı fonksiyonlar
│ └── hooks/ # Custom React hooks
├── ai-training/ # AI/ML modülleri
│ ├── tesseract_ottoman_ocr.py # Ana OCR sistemi
│ ├── advanced_ottoman_translator.py # Gelişmiş çeviri
│ ├── merged_mapping.txt # Çeviri mapping dosyası
│ ├── models/ # Eğitilmiş modeller
│ └── logs/ # Log dosyaları
├── test-pictures/ # Test görselleri
├── public/ # Statik dosyalar
├── prisma/ # Veritabanı şeması
└── examples/ # Örnek dosyalar
- Ana sayfada "Görüntü Çevirisi" bölümüne gidin
- Osmanlıca metin içeren bir görsel yükleyin
- Sistem otomatik olarak metni tanıyıp Türkçeye çevirecektir
- "Metin Çevirisi" sayfasına gidin
- Osmanlıca metni girin
- Anında Türkçe çeviriyi alın
- Ana sayfada "Osmanlıca Öğrenme Yol Haritası"nı takip edin
- 4 kategori ve 36 ders ile sistematik öğrenme
- İlerlemenizi takip edin ve XP kazanın
-
Görüntü Ön İşleme
- Grayscale dönüşümü
- CLAHE (Contrast Limited Adaptive Histogram Equalization)
- Median blur ve noise reduction
- Otsu thresholding
-
Karakter Segmentasyonu
- Connected component analysis
- Aspect ratio filtering
- DBSCAN clustering for line grouping
- Left-to-right sorting
-
Metin Tanıma
- Tesseract OCR (Arapça modeli)
- PaddleOCR (fallback)
- Hybrid decision making
- Confidence scoring
-
Post-processing
- Arabic text normalization
- Harakat removal
- Alif/Yaa variant normalization
- Whitespace normalization
- 1800+ kelime çifti mapping dosyasında
- Tam cümle çevirileri öncelikli
- Kelime bazlı çeviri fallback
- Context-aware çeviri seçimi
- Tesseract: ~85% (genel metinler)
- PaddleOCR: ~80% (modern metinler)
- Hybrid System: ~90% (optimize edilmiş)
- Mapping-based: %95+ (tanımlı kelimeler)
- Sentence-level: %98+ (tam cümle eşleşmeleri)
- Response Time: <2 saniye
Görüntüden metin çıkarma ve çeviri
Request:
{
"image": "base64_encoded_image"
}Response:
{
"extractedText": "Osmanlıca metin",
"translatedText": "Türkçe çeviri",
"ocrConfidence": 0.85,
"methodUsed": "hybrid",
"processingTime": 1.2
}Metin çevirisi
Request:
{
"text": "Osmanlıca metin"
}Response:
{
"originalText": "Osmanlıca metin",
"translatedText": "Türkçe çeviri",
"translationMethod": "mapping",
"confidence": 0.95
}cd ai-training
python tesseract_ottoman_ocr.py test-pictures/yeni1.pngcurl -X POST http://localhost:3000/api/text-translate \
-H "Content-Type: application/json" \
-d '{"text": "كتاب اوقومك انسانه حضور وئرر"}'npm run build
vercel --proddocker build -t miras-app .
docker run -p 3000:3000 miras-app- Fork yapın
- Feature branch oluşturun (
git checkout -b feature/amazing-feature) - Commit yapın (
git commit -m 'Add amazing feature') - Push yapın (
git push origin feature/amazing-feature) - Pull Request açın
Bu proje MIT lisansı altında lisanslanmıştır. Detaylar için LICENSE dosyasına bakın.
- Tesseract OCR - Açık kaynak OCR motoru
- PaddleOCR - Baidu'nun OCR çözümü
- Next.js - React framework
- Tailwind CSS - Utility-first CSS framework
- Radix UI - Erişilebilir UI bileşenleri
- Proje Linki: [GitHub Repository]
- Sorunlar: Issues
- Öneriler: Discussions
MİRAS - Osmanlıca AI Öğrenme Platformu 🏛️
Osmanlıca öğrenmeyi kolaylaştıran yapay zeka destekli platform