Skip to content

kamarli-mert/miras

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🏛️ MİRAS - Osmanlıca AI Öğrenme Platformu

Next.js React TypeScript Tailwind CSS Open Source

📖 Proje Hakkında

MİRAS, Osmanlıca metinleri modern Türkçeye çeviren ve öğrenme deneyimi sunan kapsamlı bir AI platformudur. Duolingo benzeri interaktif öğrenme arayüzü ile Osmanlıca öğrenmeyi kolaylaştırır.

🌟 Özellikler

  • 🔍 Gelişmiş OCR Sistemi: Tesseract, PaddleOCR ve özel modeller ile yüksek doğruluk
  • 🌐 Çok Dilli Çeviri: Osmanlıca → Türkçe çeviri sistemi
  • 📚 İnteraktif Öğrenme: Duolingo tarzı yol haritası ve dersler
  • 🎯 Kişiselleştirilmiş Deneyim: İlerleme takibi ve adaptif öğrenme
  • 📱 Modern Arayüz: Responsive tasarım ve kullanıcı dostu UI
  • 🔧 Açık Kaynak: Tüm bileşenler açık kaynak ve ticari kullanıma uygun

🏗️ Teknik Mimari

Frontend Stack

  • Next.js 15.3.5 - React framework
  • React 19.0.0 - UI kütüphanesi
  • TypeScript 5.0 - Tip güvenliği
  • Tailwind CSS 3.4.0 - Styling
  • Radix UI - Erişilebilir UI bileşenleri
  • Framer Motion - Animasyonlar
  • Zustand - State management

Backend Stack

  • Python - AI/ML işlemleri
  • Tesseract OCR - Metin tanıma
  • PaddleOCR - Gelişmiş OCR
  • OpenCV - Görüntü işleme
  • NumPy/SciPy - Bilimsel hesaplamalar
  • Scikit-learn - Makine öğrenmesi

AI/ML Bileşenleri

  • Hybrid OCR System: Tesseract + PaddleOCR + Custom Models
  • Advanced Image Processing: CLAHE, Otsu thresholding, morphological operations
  • Character Segmentation: Connected component analysis, DBSCAN clustering
  • Text Post-processing: Arabic text normalization, grammar rules
  • Translation Engine: Mapping-based translation with 1800+ word pairs

🚀 Kurulum

Gereksinimler

  • Node.js 18+
  • Python 3.8+
  • Tesseract OCR
  • Git

1. Projeyi Klonlayın

git clone <repository-url>
cd yenideneme

2. Frontend Bağımlılıklarını Yükleyin

npm install

3. Python Sanal Ortamı Oluşturun

cd ai-training
python -m venv .venv
source .venv/bin/activate  # Linux/Mac
# veya
.venv\Scripts\activate     # Windows

4. Python Bağımlılıklarını Yükleyin

pip install -r requirements.txt

5. Tesseract OCR Kurulumu

Windows:

# Chocolatey ile
choco install tesseract

# veya manuel kurulum
# https://github.com/UB-Mannheim/tesseract/wiki

macOS:

brew install tesseract

Linux:

sudo apt-get install tesseract-ocr
sudo apt-get install tesseract-ocr-ara  # Arapça desteği

6. Geliştirme Sunucusunu Başlatın

# Terminal 1: Frontend
npm run dev

# Terminal 2: Backend (gerekirse)
cd ai-training
python tesseract_ottoman_ocr.py

📁 Proje Yapısı

yenideneme/
├── src/                          # Frontend kaynak kodları
│   ├── app/                      # Next.js App Router
│   │   ├── api/                  # API routes
│   │   │   ├── ocr-translate/    # OCR ve çeviri API
│   │   │   ├── text-translate/   # Metin çeviri API
│   │   │   └── analyze-image/    # Görüntü analiz API
│   │   ├── image-translation/    # Görüntü çeviri sayfası
│   │   ├── text-translation/     # Metin çeviri sayfası
│   │   └── roadmap/              # Öğrenme yol haritası
│   ├── components/               # React bileşenleri
│   ├── lib/                      # Yardımcı fonksiyonlar
│   └── hooks/                    # Custom React hooks
├── ai-training/                  # AI/ML modülleri
│   ├── tesseract_ottoman_ocr.py  # Ana OCR sistemi
│   ├── advanced_ottoman_translator.py  # Gelişmiş çeviri
│   ├── merged_mapping.txt        # Çeviri mapping dosyası
│   ├── models/                   # Eğitilmiş modeller
│   └── logs/                     # Log dosyaları
├── test-pictures/                # Test görselleri
├── public/                       # Statik dosyalar
├── prisma/                       # Veritabanı şeması
└── examples/                     # Örnek dosyalar

🔧 Kullanım

1. Görüntü Çevirisi

  1. Ana sayfada "Görüntü Çevirisi" bölümüne gidin
  2. Osmanlıca metin içeren bir görsel yükleyin
  3. Sistem otomatik olarak metni tanıyıp Türkçeye çevirecektir

2. Metin Çevirisi

  1. "Metin Çevirisi" sayfasına gidin
  2. Osmanlıca metni girin
  3. Anında Türkçe çeviriyi alın

3. Öğrenme Yol Haritası

  1. Ana sayfada "Osmanlıca Öğrenme Yol Haritası"nı takip edin
  2. 4 kategori ve 36 ders ile sistematik öğrenme
  3. İlerlemenizi takip edin ve XP kazanın

🤖 AI Sistemi Detayları

OCR Pipeline

  1. Görüntü Ön İşleme

    • Grayscale dönüşümü
    • CLAHE (Contrast Limited Adaptive Histogram Equalization)
    • Median blur ve noise reduction
    • Otsu thresholding
  2. Karakter Segmentasyonu

    • Connected component analysis
    • Aspect ratio filtering
    • DBSCAN clustering for line grouping
    • Left-to-right sorting
  3. Metin Tanıma

    • Tesseract OCR (Arapça modeli)
    • PaddleOCR (fallback)
    • Hybrid decision making
    • Confidence scoring
  4. Post-processing

    • Arabic text normalization
    • Harakat removal
    • Alif/Yaa variant normalization
    • Whitespace normalization

Çeviri Sistemi

  • 1800+ kelime çifti mapping dosyasında
  • Tam cümle çevirileri öncelikli
  • Kelime bazlı çeviri fallback
  • Context-aware çeviri seçimi

📊 Performans Metrikleri

OCR Doğruluğu

  • Tesseract: ~85% (genel metinler)
  • PaddleOCR: ~80% (modern metinler)
  • Hybrid System: ~90% (optimize edilmiş)

Çeviri Kalitesi

  • Mapping-based: %95+ (tanımlı kelimeler)
  • Sentence-level: %98+ (tam cümle eşleşmeleri)
  • Response Time: <2 saniye

🔄 API Endpoints

POST /api/ocr-translate

Görüntüden metin çıkarma ve çeviri

Request:

{
  "image": "base64_encoded_image"
}

Response:

{
  "extractedText": "Osmanlıca metin",
  "translatedText": "Türkçe çeviri",
  "ocrConfidence": 0.85,
  "methodUsed": "hybrid",
  "processingTime": 1.2
}

POST /api/text-translate

Metin çevirisi

Request:

{
  "text": "Osmanlıca metin"
}

Response:

{
  "originalText": "Osmanlıca metin",
  "translatedText": "Türkçe çeviri",
  "translationMethod": "mapping",
  "confidence": 0.95
}

🧪 Test

OCR Test

cd ai-training
python tesseract_ottoman_ocr.py test-pictures/yeni1.png

Çeviri Test

curl -X POST http://localhost:3000/api/text-translate \
  -H "Content-Type: application/json" \
  -d '{"text": "كتاب اوقومك انسانه حضور وئرر"}'

🚀 Deployment

Vercel Deployment

npm run build
vercel --prod

Docker Deployment

docker build -t miras-app .
docker run -p 3000:3000 miras-app

🤝 Katkıda Bulunma

  1. Fork yapın
  2. Feature branch oluşturun (git checkout -b feature/amazing-feature)
  3. Commit yapın (git commit -m 'Add amazing feature')
  4. Push yapın (git push origin feature/amazing-feature)
  5. Pull Request açın

📝 Lisans

Bu proje MIT lisansı altında lisanslanmıştır. Detaylar için LICENSE dosyasına bakın.

🙏 Teşekkürler

  • Tesseract OCR - Açık kaynak OCR motoru
  • PaddleOCR - Baidu'nun OCR çözümü
  • Next.js - React framework
  • Tailwind CSS - Utility-first CSS framework
  • Radix UI - Erişilebilir UI bileşenleri

📞 İletişim


MİRAS - Osmanlıca AI Öğrenme Platformu 🏛️

Osmanlıca öğrenmeyi kolaylaştıran yapay zeka destekli platform

About

No description or website provided.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published