Urdu-to-English Machine Translation using LSTM with Attention

Overview

This project implements an LSTM-based attention encoder-decoder model for machine translation from Urdu to English using PyTorch. The model is trained on a parallel dataset and evaluated using BLEU scores to measure translation quality.

Dataset

Source: Provided parallel dataset (sentence-aligned).
Preprocessing:
- Merge .dev and .devtest files.
- Shuffle and split into 70% training, 15% validation, and 15% test.

Model Architecture

Encoder: Bi-directional LSTM processes Urdu input sequences.
Attention Mechanism: Enhances focus on relevant words during decoding.
Decoder: LSTM generates translated English text based on encoder outputs and attention.
Implementation: Custom PyTorch model (no pre-built RNN libraries used).

Evaluation

Train & Validation Metrics:
- Loss curve visualization.
- BLEU score tracking during training.
Final Performance:
- 0.46 BLEU score using Moses multi-bleu.perl on the test set.

🚀 This project demonstrates an end-to-end Urdu-to-English translation pipeline using deep learning and attention mechanisms!

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Dataset		Dataset
LICENSE		LICENSE
README.md		README.md
multi-bleu.perl		multi-bleu.perl
urdu2english_nmt.ipynb		urdu2english_nmt.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Urdu-to-English Machine Translation using LSTM with Attention

Overview

Dataset

Model Architecture

Evaluation

About

Releases

Packages

Languages

License

Vaneeza-7/Urdu-to-English-Neural-Machine-Translation

Folders and files

Latest commit

History

Repository files navigation

Urdu-to-English Machine Translation using LSTM with Attention

Overview

Dataset

Model Architecture

Evaluation

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages