> SYSTEM STANDBY

Developer Avatar
# Developer Console
v2.0.26 - TrietOS Kernel
CPU0%
RAM0%
DISK0%
NET0Mb/s
Booting:
0%
triet@devops: ~

Nguyen Huynh Thanh Triet

📍 Ho Chi Minh City, VietnamTP. Hồ Chí Minh, Việt Nam

📞 (+84) 0917 446 937

✉️ trietpl1999@gmail.com

🔗 linkedin.com/in/nhttriet

GitHub github.com/********

Facebook facebook.com/********

Results-driven DevOps Engineer with nearly 4 years of experience specializing in cloud infrastructure (AWS), container orchestration (Kubernetes), and CI/CD automation. Proven track record of designing highly available microservices architectures supporting millions of requests per second (RPS). Expert in building AI-assisted observability platforms and automating complex operational workflows to achieve 99.99% system uptime and zero downtime during large-scale migrations.

Kỹ sư DevOps định hướng kết quả với gần 4 năm kinh nghiệm chuyên sâu về hạ tầng đám mây (AWS), điều phối container (Kubernetes) và tự động hóa CI/CD. Đã chứng minh năng lực thiết kế kiến trúc microservices tính sẵn sàng cao, chịu tải hàng triệu request mỗi giây (RPS). Chuyên gia trong việc xây dựng nền tảng giám sát hệ thống tích hợp AI và tự động hóa các quy trình vận hành phức tạp, đạt uptime 99.99% và không gián đoạn (zero downtime) trong các đợt di chuyển hệ thống lớn.

Nguyen Huynh Thanh Triet

Skills & Expertise

Kỹ năng & Chuyên môn

Cloud & Kubernetes

Đám mây & Kubernetes

AWS (VPC, EC2, ECS, RDS, Lambda), Docker, Kubernetes (On-prem)

AWS Docker Kubernetes AWS Docker Kubernetes AWS Docker Kubernetes AWS Docker Kubernetes AWS Docker Kubernetes AWS Docker Kubernetes

CI/CD & Scripting

CI/CD & Kịch bản

Jenkins, GitLab CI, Python, Bash, Groovy, Unleash

Jenkins GitLab Python Bash Jenkins GitLab Python Bash Jenkins GitLab Python Bash Jenkins GitLab Python Bash

Data & Middleware

Dữ liệu & Middleware

Kafka, RabbitMQ, Redis, Oracle, Elasticsearch, Cassandra

Kafka RabbitMQ Redis Oracle Elasticsearch Kafka RabbitMQ Redis Oracle Elasticsearch Kafka RabbitMQ Redis Oracle Elasticsearch Kafka RabbitMQ Redis Oracle Elasticsearch

Observability

Giám sát hệ thống

Prometheus, Grafana (Auto-rule generation), Score Eye AI, ELK Stack

Prometheus Grafana Elasticsearch Logstash Kibana Prometheus Grafana Elasticsearch Logstash Kibana Prometheus Grafana Elasticsearch Logstash Kibana Prometheus Grafana Elasticsearch Logstash Kibana

Networking & OS

Mạng & Hệ điều hành

Linux (CentOS, RedHat), OSI Model, DNS, SSH, Load Balancing

Linux RedHat Ubuntu Linux RedHat Ubuntu Linux RedHat Ubuntu Linux RedHat Ubuntu

Architecture & Projects

Kiến trúc & Dự án

AWS [ View Architecture ]

High-Availability Core System

Hệ thống Core Tính sẵn sàng cao

Designed a multi-AZ AWS architecture utilizing ECS, RDS Multi-AZ, and ElastiCache. Achieved 99.99% uptime during peak loads of thousands of RPS.

Thiết kế kiến trúc AWS Multi-AZ sử dụng ECS, RDS Multi-AZ và ElastiCache. Đạt thời gian hoạt động (uptime) 99.99% trong các thời gian cao điểm với hàng nghìn RPS.

Kubernetes [ View Architecture ]

Cloud Native K8s Architecture

Kiến trúc Cloud Native K8s

Designed and deployed a highly resilient microservices architecture utilizing NGINX, APISIX API Gateway, and Istio Service Mesh on Kubernetes, with comprehensive observability via Prometheus and Grafana.

Thiết kế và triển khai kiến trúc microservices khả năng phục hồi cao sử dụng NGINX, APISIX API Gateway và Istio Service Mesh trên Kubernetes, với hệ thống giám sát toàn diện thông qua Prometheus và Grafana.

Score-Eye [ View Architecture ]

Score-Eye: Intelligent SRE Platform

Score-Eye: Nền tảng SRE & Giám sát Thông minh

SRE automation platform for FinTech payment core. Features rule-based anomaly detection (zero-traffic, latency spikes), state-machine validation via Redis to prevent false positives, and ChatOps integration (Google Chat, Jira) for automated NOC alerting.

Hệ thống giám sát và tự động hóa cảnh báo (SRE Automation) cho lõi thanh toán FinTech. Phát hiện bất thường (Zero-traffic, Latency spike) bằng Rules, dùng State-machine qua Redis chống báo lỗi giả và tích hợp ChatOps (Google Chat/Jira) để xử lý sự cố.

Python FastAPI VictoriaMetrics Redis Kafka Grafana

Work Experience

Kinh nghiệm Làm việc

11/2024 – PRESENT
11/2024 – HIỆN TẠI

Middle Operation Engineer

Kỹ sư Vận hành (Middle)

M_Service (MoMo) | Ho Chi Minh City, VN
M_Service (MoMo) | TP. Hồ Chí Minh, VN
🏆 Achievement: Best Incident Handling Team Award — MoMo 2025
🏆 Thành tích: Giải thưởng Đội xử lý sự cố xuất sắc nhất — MoMo 2025
  • Reliability & Scale: Owned end-to-end reliability and incident response for 3 core cells (Payment, CVS, Autodebit), supporting 25M+ daily active users.
  • AI-Assisted Observability: Built an AI platform from scratch using Python/Cursor to auto-generate Grafana alert rules for 200+ microservices. Cut alert fatigue by 60%, improved accuracy from 65% to 92%.
  • Infrastructure Migration: Migrated 2 K8s clusters (UAT + PROD) with 99.99% uptime for 100+ services; designed automated rollback checkpoints.
  • Middleware Upgrade: Upgraded Kafka & RabbitMQ clusters (20K+ queues) supporting 50M+ daily transactions with zero message loss.
  • Automation & Tooling: Developed SCore-One Bot (Google Chat) for mobile execution of build/tag ops, eliminating 80% of manual GitLab CI interactions.
  • Deployment & DR: Implemented Unleash feature flags, reducing deployment incidents by 70%. Designed DR site (RTO < 2 hours, RPO < 30 mins).
  • Độ tin cậy & Mở rộng: Chịu trách nhiệm toàn bộ quá trình vận hành và xử lý sự cố cho 3 cụm lõi (Payment, CVS, Autodebit), phục vụ hơn 25 triệu người dùng hoạt động hàng ngày.
  • Giám sát hỗ trợ bởi AI: Xây dựng nền tảng AI từ đầu bằng Python/Cursor để tự động tạo bộ quy tắc cảnh báo Grafana cho hơn 200 microservices. Giảm 60% cảnh báo rác, tăng độ chính xác từ 65% lên 92%.
  • Di chuyển Hạ tầng: Chuyển đổi 2 cụm Kubernetes (UAT + PROD) với uptime 99.99% cho hơn 100 services; thiết kế các điểm kiểm tra rollback tự động.
  • Nâng cấp Middleware: Nâng cấp cụm Kafka & RabbitMQ (hơn 20K queues) xử lý hơn 50 triệu giao dịch mỗi ngày mà không làm mất bản tin nào.
  • Tự động hóa & Công cụ: Phát triển Bot SCore-One (Google Chat) cho phép thực thi thao tác build/tag trên điện thoại, loại bỏ 80% thao tác thủ công trên GitLab CI.
  • Triển khai & Dự phòng DR: Triển khai tính năng cờ (Feature flags) qua Unleash, giảm 70% sự cố khi deploy. Thiết kế site dự phòng thảm họa (DR) (RTO < 2 giờ, RPO < 30 phút).
04/2024 – 11/2024
04/2024 – 11/2024

DevOps Engineer

Kỹ sư DevOps

CMC Global | Ho Chi Minh City, VN
CMC Global | TP. Hồ Chí Minh, VN
Project: FE Credit Vietnam
Dự án: FE Credit Việt Nam
  • Ensured high availability for critical financial systems by automating CI/CD pipelines and managing Infrastructure as Code (IaC).
  • Implemented robust system monitoring and provided tier-2 operational support to resolve production incidents efficiently.
  • Đảm bảo tính sẵn sàng cao cho các hệ thống tài chính trọng yếu bằng cách tự động hóa quy trình CI/CD và quản lý Hạ tầng dưới dạng Code (IaC).
  • Triển khai giám sát hệ thống mạnh mẽ và hỗ trợ vận hành cấp độ 2 (tier-2) để giải quyết hiệu quả các sự cố trên môi trường production.
02/2022 – 04/2024
02/2022 – 04/2024

DevOps Engineer

Kỹ sư DevOps

DXC Technology | Ho Chi Minh City, VN
DXC Technology | TP. Hồ Chí Minh, VN
Projects: Shinhan Life Viet Nam, United Cooperative Assurance
Dự án: Shinhan Life Việt Nam, United Cooperative Assurance
  • CI/CD Automation: Streamlined operations by automating CI/CD pipelines using Jenkins and Git, reducing deployment times by 20%.
  • Infrastructure Management: Proactively administered and monitored high-availability systems across AWS ECS, Kubernetes, and Linux environments.
  • Database Management: Managed AWS RDS Oracle operations, including automated backups and point-in-time restoration procedures.
  • Security & Compliance: Resolved critical system alerts promptly and ensured system security through industry best practices.
  • Tự động hóa CI/CD: Tối ưu hóa vận hành thông qua tự động hóa quy trình CI/CD bằng Jenkins và Git, giảm 20% thời gian triển khai.
  • Quản trị Hạ tầng: Quản trị và giám sát chủ động các hệ thống tính sẵn sàng cao trên AWS ECS, Kubernetes và các môi trường Linux.
  • Quản trị Cơ sở Dữ liệu: Vận hành AWS RDS Oracle, bao gồm sao lưu tự động và quy trình phục hồi tại các thời điểm (Point-in-time).
  • Bảo mật & Tuân thủ: Xử lý kịp thời các cảnh báo hệ thống nghiêm trọng và đảm bảo an ninh hệ thống qua các tiêu chuẩn công nghiệp tốt nhất.

Education

Học vấn

Master of Computer Science

Thạc sĩ Khoa học Máy tính

Saigon International University

Đại học Quốc tế Sài Gòn (SIU)

2025 – Present 2025 – Hiện tại

Bachelor of Network Eng.

Cử nhân Mạng máy tính

University of Science (VNU-HCM)

Trường ĐH Khoa học Tự nhiên (VNU-HCM)

2018 – 2022

Languages

Ngôn ngữ

  • Vietnamese Tiếng Việt Native Bản ngữ
  • English Tiếng Anh Intermediate Khá

Unlock Full Profile

Mở khóa Toàn bộ Hồ sơ

ID

Login for more information

Đăng nhập để xem thêm thông tin

© 2026 Nguyen Huynh Thanh Triet.

© 2026 Nguyễn Huỳnh Thanh Triết.