Nguyen Huynh Thanh Triet
▋
📍 Ho Chi Minh City, VietnamTP. Hồ Chí Minh, Việt Nam
📞 (+84) 0917 446 937
Results-driven DevOps Engineer with nearly 4 years of experience specializing in cloud infrastructure (AWS), container orchestration (Kubernetes), and CI/CD automation. Proven track record of designing highly available microservices architectures supporting millions of requests per second (RPS). Expert in building AI-assisted observability platforms and automating complex operational workflows to achieve 99.99% system uptime and zero downtime during large-scale migrations.
Kỹ sư DevOps định hướng kết quả với gần 4 năm kinh nghiệm chuyên sâu về hạ tầng đám mây (AWS), điều phối container (Kubernetes) và tự động hóa CI/CD. Đã chứng minh năng lực thiết kế kiến trúc microservices tính sẵn sàng cao, chịu tải hàng triệu request mỗi giây (RPS). Chuyên gia trong việc xây dựng nền tảng giám sát hệ thống tích hợp AI và tự động hóa các quy trình vận hành phức tạp, đạt uptime 99.99% và không gián đoạn (zero downtime) trong các đợt di chuyển hệ thống lớn.
Skills & Expertise
Kỹ năng & Chuyên môn
Cloud & Kubernetes
Đám mây & Kubernetes
AWS (VPC, EC2, ECS, RDS, Lambda), Docker, Kubernetes (On-prem)
CI/CD & Scripting
CI/CD & Kịch bản
Jenkins, GitLab CI, Python, Bash, Groovy, Unleash
Data & Middleware
Dữ liệu & Middleware
Kafka, RabbitMQ, Redis, Oracle, Elasticsearch, Cassandra
Observability
Giám sát hệ thống
Prometheus, Grafana (Auto-rule generation), Score Eye AI, ELK Stack
Networking & OS
Mạng & Hệ điều hành
Linux (CentOS, RedHat), OSI Model, DNS, SSH, Load Balancing
Architecture & Projects
Kiến trúc & Dự án
High-Availability Core System
Hệ thống Core Tính sẵn sàng cao
Designed a multi-AZ AWS architecture utilizing ECS, RDS Multi-AZ, and ElastiCache. Achieved 99.99% uptime during peak loads of thousands of RPS.
Thiết kế kiến trúc AWS Multi-AZ sử dụng ECS, RDS Multi-AZ và ElastiCache. Đạt thời gian hoạt động (uptime) 99.99% trong các thời gian cao điểm với hàng nghìn RPS.
Cloud Native K8s Architecture
Kiến trúc Cloud Native K8s
Designed and deployed a highly resilient microservices architecture utilizing NGINX, APISIX API Gateway, and Istio Service Mesh on Kubernetes, with comprehensive observability via Prometheus and Grafana.
Thiết kế và triển khai kiến trúc microservices khả năng phục hồi cao sử dụng NGINX, APISIX API Gateway và Istio Service Mesh trên Kubernetes, với hệ thống giám sát toàn diện thông qua Prometheus và Grafana.
Score-Eye: Intelligent SRE Platform
Score-Eye: Nền tảng SRE & Giám sát Thông minh
SRE automation platform for FinTech payment core. Features rule-based anomaly detection (zero-traffic, latency spikes), state-machine validation via Redis to prevent false positives, and ChatOps integration (Google Chat, Jira) for automated NOC alerting.
Hệ thống giám sát và tự động hóa cảnh báo (SRE Automation) cho lõi thanh toán FinTech. Phát hiện bất thường (Zero-traffic, Latency spike) bằng Rules, dùng State-machine qua Redis chống báo lỗi giả và tích hợp ChatOps (Google Chat/Jira) để xử lý sự cố.
Work Experience
Kinh nghiệm Làm việc
Middle Operation Engineer
Kỹ sư Vận hành (Middle)
- Reliability & Scale: Owned end-to-end reliability and incident response for 3 core cells (Payment, CVS, Autodebit), supporting 25M+ daily active users.
- AI-Assisted Observability: Built an AI platform from scratch using Python/Cursor to auto-generate Grafana alert rules for 200+ microservices. Cut alert fatigue by 60%, improved accuracy from 65% to 92%.
- Infrastructure Migration: Migrated 2 K8s clusters (UAT + PROD) with 99.99% uptime for 100+ services; designed automated rollback checkpoints.
- Middleware Upgrade: Upgraded Kafka & RabbitMQ clusters (20K+ queues) supporting 50M+ daily transactions with zero message loss.
- Automation & Tooling: Developed SCore-One Bot (Google Chat) for mobile execution of build/tag ops, eliminating 80% of manual GitLab CI interactions.
- Deployment & DR: Implemented Unleash feature flags, reducing deployment incidents by 70%. Designed DR site (RTO < 2 hours, RPO < 30 mins).
- Độ tin cậy & Mở rộng: Chịu trách nhiệm toàn bộ quá trình vận hành và xử lý sự cố cho 3 cụm lõi (Payment, CVS, Autodebit), phục vụ hơn 25 triệu người dùng hoạt động hàng ngày.
- Giám sát hỗ trợ bởi AI: Xây dựng nền tảng AI từ đầu bằng Python/Cursor để tự động tạo bộ quy tắc cảnh báo Grafana cho hơn 200 microservices. Giảm 60% cảnh báo rác, tăng độ chính xác từ 65% lên 92%.
- Di chuyển Hạ tầng: Chuyển đổi 2 cụm Kubernetes (UAT + PROD) với uptime 99.99% cho hơn 100 services; thiết kế các điểm kiểm tra rollback tự động.
- Nâng cấp Middleware: Nâng cấp cụm Kafka & RabbitMQ (hơn 20K queues) xử lý hơn 50 triệu giao dịch mỗi ngày mà không làm mất bản tin nào.
- Tự động hóa & Công cụ: Phát triển Bot SCore-One (Google Chat) cho phép thực thi thao tác build/tag trên điện thoại, loại bỏ 80% thao tác thủ công trên GitLab CI.
- Triển khai & Dự phòng DR: Triển khai tính năng cờ (Feature flags) qua Unleash, giảm 70% sự cố khi deploy. Thiết kế site dự phòng thảm họa (DR) (RTO < 2 giờ, RPO < 30 phút).
- Ensured high availability for critical financial systems by automating CI/CD pipelines and managing Infrastructure as Code (IaC).
- Implemented robust system monitoring and provided tier-2 operational support to resolve production incidents efficiently.
- Đảm bảo tính sẵn sàng cao cho các hệ thống tài chính trọng yếu bằng cách tự động hóa quy trình CI/CD và quản lý Hạ tầng dưới dạng Code (IaC).
- Triển khai giám sát hệ thống mạnh mẽ và hỗ trợ vận hành cấp độ 2 (tier-2) để giải quyết hiệu quả các sự cố trên môi trường production.
DevOps Engineer
Kỹ sư DevOps
- CI/CD Automation: Streamlined operations by automating CI/CD pipelines using Jenkins and Git, reducing deployment times by 20%.
- Infrastructure Management: Proactively administered and monitored high-availability systems across AWS ECS, Kubernetes, and Linux environments.
- Database Management: Managed AWS RDS Oracle operations, including automated backups and point-in-time restoration procedures.
- Security & Compliance: Resolved critical system alerts promptly and ensured system security through industry best practices.
- Tự động hóa CI/CD: Tối ưu hóa vận hành thông qua tự động hóa quy trình CI/CD bằng Jenkins và Git, giảm 20% thời gian triển khai.
- Quản trị Hạ tầng: Quản trị và giám sát chủ động các hệ thống tính sẵn sàng cao trên AWS ECS, Kubernetes và các môi trường Linux.
- Quản trị Cơ sở Dữ liệu: Vận hành AWS RDS Oracle, bao gồm sao lưu tự động và quy trình phục hồi tại các thời điểm (Point-in-time).
- Bảo mật & Tuân thủ: Xử lý kịp thời các cảnh báo hệ thống nghiêm trọng và đảm bảo an ninh hệ thống qua các tiêu chuẩn công nghiệp tốt nhất.
Education
Học vấn
Master of Computer Science
Thạc sĩ Khoa học Máy tính
Saigon International University
Đại học Quốc tế Sài Gòn (SIU)
2025 – Present 2025 – Hiện tạiBachelor of Network Eng.
Cử nhân Mạng máy tính
University of Science (VNU-HCM)
Trường ĐH Khoa học Tự nhiên (VNU-HCM)
2018 – 2022Languages
Ngôn ngữ
- Vietnamese Tiếng Việt Native Bản ngữ
- English Tiếng Anh Intermediate Khá
Unlock Full Profile
Mở khóa Toàn bộ Hồ sơ
Login for more information
Đăng nhập để xem thêm thông tin