Các mô hình ngôn ngữ lớn (LLM) với 400 tỷ tham số thông thường đòi hỏi phần cứng chuyên dụng với dung lượng RAM khổng lồ. Ngay cả phiên bản đã được nén (quantized) cũng cần tối thiểu 200 GB RAM. Với yêu cầu như vậy, iPhone 17 Pro vốn chỉ trang bị 12 GB LPDDR5X RAM được xem là hoàn toàn ngoài cuộc. Tuy nhiên, một đoạn video mới đây cho thấy điều tưởng như không thể đã xảy ra, và ẩn sau đó là một số kỹ thuật khéo léo đáng chú ý.
Người dùng @anemll đã công bố video chạy thử Flash-MoE, một dự án mã nguồn mở, trực tiếp trên iPhone 17 Pro. Kết quả cho thấy chiếc điện thoại thực sự xử lý được mô hình 400 tỷ tham số này, nhưng tốc độ sinh văn bản chỉ đạt 0.6 token/giây, tương đương khoảng một từ được tạo ra sau mỗi 1,5 đến 2 giây. Đây là tốc độ cực kỳ chậm so với trải nghiệm thực tế, và sẽ khiến phần lớn người dùng nhanh chóng mất kiên nhẫn.
Chạy model AI 400 tỷ tham số trên chính chiếc iPhone 17 Pro, tốc độ 0,6 token/giây
Bí quyết để vượt qua giới hạn RAM nằm ở cách Flash-MoE vận hành: thay vì nạp toàn bộ mô hình vào bộ nhớ (điều hiển nhiên là bất khả thi với 12 GB RAM), dự án này tận dụng bộ nhớ lưu trữ SSD của thiết bị để stream dữ liệu trực tiếp lên GPU theo từng phần nhỏ khi cần. Đây là phương pháp tương tự kỹ thuật memory-mapped inference vốn được dùng trên máy tính để bàn khi VRAM không đủ đáp ứng mô hình lớn. 
Tải VPBank

Ngoài ra, chữ “MoE” trong tên Flash-MoE là viết tắt của Mixture of Experts, một kiến trúc mô hình đặc biệt trong đó chỉ một phần nhỏ trong tổng số 400 tỷ tham số được kích hoạt cho mỗi token sinh ra. Điều này giúp giảm đáng kể lượng dữ liệu cần xử lý tại một thời điểm, tạo điều kiện để kỹ thuật stream SSD hoạt động khả thi hơn trên phần cứng di động.
Một điểm đáng chú ý khi chạy LLM cục bộ theo cách này là toàn bộ quá trình xử lý diễn ra hoàn toàn trên thiết bị, không cần kết nối internet, và đảm bảo quyền riêng tư tuyệt đối: 100% dữ liệu không rời khỏi máy. Tuy nhiên, chi phí phải trả là mức tiêu thụ pin rất cao khi GPU phải duy trì hoạt động liên tục trong suốt quá trình sinh văn bản.
Các nhà phát triển cũng thường dùng phiên bản quantized của LLM để giảm yêu cầu phần cứng, nhưng ngay cả bản nén của mô hình 400 tỷ tham số vẫn cần tối thiểu 200 GB RAM nếu chạy theo cách thông thường, con số vượt xa bất kỳ smartphone nào hiện tại. Thực tế này cho thấy khoảng cách lớn giữa việc “chạy được” một mô hình và việc sử dụng nó ở mức độ thực dụng. Flash-MoE trên iPhone 17 Pro đã vượt qua rào cản đầu tiên, nhưng với 0.6 token/giây, rào cản thứ hai vẫn còn rất xa. Tầm xa hồng ngoại 10m với công nghệ hống ngoại thông
minh.
Chống ngược sáng HDR
- Hỗ trợ đàm thoại 2 chiều
- Hỗ trợ các tính năng thông minh: phát hiện chuyển động,
phát hiện con người, phát hiện âm thanh bất thường, chế
độ riêng tu, Smart tracking.
Tích hợp còi báo động
- Hỗ trợ chức năng Soft-AP, kết nối trực tiếp wifi camera
không cần thông qua modem nhà mạng.
Tích hợp Wi-Fi(IEEE802.11b/g/n), LAN, CLOUD (Imou
Protect), ONVIF
- Hỗ trơ khe cắm thẻ nhớ Micro SD max 256GB
- Nguổn cấp: DC 5V1A, điện năng tiêu thụ - Chất liệu vỏ:
Plastic.
Đạt chứng nhận CE, FCC
Xuất xứ: Trung Quốc
⁃ Bảo hành: 24 tháng.
Trọn bộ sản phẩm bao gồm:
-1 x Camera
- 1 x Hướng dẫn Bắt đầu Nhanh
-1x Bộ đổi nguồn
-1x Cáp nguồn
-1x Bọt gắn
Hàng chính hãng imou bảo hành 2 năm toàn quốc
Camera imou A32EP 3MP
Nguồn Trang : https://genk.vn/iphone-17-pro-chay-duoc-mo-hinh-ai-400-ty-tham-so-nho-thu-thuat-stream-tu-ssd-165262303235145431.chn
Bài viết gợi ý
- Robot Hút Bụi Xiaomi Chính Hãng. Giá Tốt
Robot hút bụi Xiaomi là thiết bị thông minh tự động hóa việc dọn dẹp nhà cửa nhờ công nghệ hiện đại, lực hút mạnh mẽ và khả năng kết nối app tiện lợi. Đây là lựa chọn tối ưu giúp nâng cao chất lượng sống, tiết kiệm thời gian và công sức cho mọi gia đình hiện đại. Giới thiệu chung về robot hút b�...
- Phi Thanh Vân thức đến 1h sáng viết tâm thư gửi Miu Lê sau scandal ma túy
- Sân chơi smartwatch chào đón những gương mặt mới từ nhà Garmin, HUAWEI, Xiaomi,... nhiều ưu đãi giảm giá và quà tặng kèm
- CÔ GÁI nghèo mồ côi Cha Mẹ, vất vả tìm kiếm từng BỮA CƠM - tập 1706
- Cậu bé bị bắt cóc, nhốt trong hầm lúc 5 tuổi, giờ ra sao?
- Ai là nữ bộ trưởng của 2 bộ, được gọi là 'sứ giả hòa bình' của Việt Nam?
- Nồi Cơm Điện Sharp: Đánh Giá Chi Tiết & So Sánh Các Loại
- Bảng xếp hạng giải U17 Đông Nam Á 2026 mới nhất



![[Computex 2026] Alienware ra mắt màn hình OLED 5K 39 inch đột phá 3 Alienware 39 5K OLED Gaming Monitor AW3926QW 01](https://www.quanghungmedia.com/wp-content/uploads/Alienware-39-5K-OLED-Gaming-Monitor-AW3926QW-01-300x169.jpg)
![[Computex 2026] ROG kỷ niệm 20 năm với bộ sưu tập Edition 20: Hệ sinh thái gaming hiệu năng cực hạn bước vào kỷ nguyên AI 4 ROTG1639160715651160734](https://www.quanghungmedia.com/wp-content/uploads/ROTG1639160715651160734-300x169.jpg)


![[Computex 2026] ASUS ra mắt ProArt P16, P14 và mini PC mới: Trang bị NVIDIA RTX Spark, tái định nghĩa máy tính sáng tạo 7 APSL639160694236498481](https://www.quanghungmedia.com/wp-content/uploads/APSL639160694236498481-300x169.jpg)
![[Computex 2026] Intel ra mắt Arc G-Series: Chip gaming mới cho handheld gaming 9 Arc G Series 1](https://www.quanghungmedia.com/wp-content/uploads/Arc-G-Series-1-300x169.jpg)