CEO bí ẩn của DeepSeek - ông chú AI đang làm chao đảo thế giới

CocPinky7086

New member
Liang Wenfeng - CEO của DeepSeek - là người cực kỳ low-key, hiếm khi lên sóng và chỉ xuất hiện qua vài cuộc phỏng vấn vào năm 2023 và 2024 thôi nha!

DeepSeek do ông chú quản lý quỹ đầu tư Liang Wenfeng thành lập, vừa thả bom mô hình R1 vào ngày 20/1 kèm theo một bài báo chi tiết phác thảo cách đào tạo mô hình học tăng cường (RL) quy mô lớn mà không cần dựa vào điều chỉnh tinh chỉnh có giám sát (SFT) - nghe xịn sò phết đúng không?

Chỉ trong vài ngày, ứng dụng DeepSeek đã bay lên top 1 bảng xếp hạng ứng dụng miễn phí trên iPhone ở cả Trung Quốc lẫn Mỹ, vượt mặt luôn ChatGPT - app từng gây bão trước đó. Đỉnh của chóp luôn!

55224cfca869bcab5e30.jpg


Việc phát hành mô hình R1 của DeepSeek đã làm dậy sóng Silicon Valley, khiến mọi người tranh cãi xem liệu các công ty AI của Mỹ như Meta và OpenAI - với nguồn lực khủng hơn nhiều - có thể giữ được lợi thế công nghệ không. Drama căng đét!

Trong khi đó, nhà sáng lập DeepSeek - Liang Wenfeng trở thành tâm điểm bàn tán ở Trung Quốc. Tuần trước, ông được mời tham dự hội thảo ở Bắc Kinh, nơi Thủ tướng Trung Quốc Lý Cường lắng nghe ý kiến từ các chuyên gia, doanh nhân về dự thảo báo cáo công tác của chính phủ. Tầm ảnh hưởng không phải dạng vừa đâu!

**Vì sao DeepSeek Trung Quốc gây chấn động toàn cầu?**

**Liang Wenfeng là ai?**

Xuất thân từ Quảng Đông, Liang đến Đại học Chiết Giang, Hàng Châu để học thông tin điện tử và thị giác máy tính - một lĩnh vực AI đào tạo máy tính để hiểu hình ảnh và video. Cùng hội bạn thân đại học, Liang bắt đầu nghiên cứu cách dùng AI để tự động hóa đầu tư cổ phiếu. Gen Z mà đã nghĩ xa vậy sao?

Kinh nghiệm này giúp Liang đồng sáng lập High-Flyer Quant - công ty dùng AI quản lý một trong những quỹ đầu tư định lượng lớn nhất Trung Quốc đại lục. High-Flyer Quant tăng tài sản được quản lý gấp 10 lần trong 4 năm, từ 1 tỷ nhân dân tệ năm 2016 lên hơn 10 tỷ nhân dân tệ năm 2019. Tăng trưởng khủng vãi!

"Trong những năm qua, High-Flyer Quant chi một phần lớn lợi nhuận vào AI để xây dựng cơ sở hạ tầng và tiến hành nghiên cứu quy mô lớn", công ty cho biết vào tháng 4/2023. Vài tháng sau, High-Flyer Quant tách DeepSeek ra, công ty tung một loạt mô hình AI để các dev xây dựng app bên thứ ba và tạo chatbot riêng.

Theo hãng truyền thông địa phương 36kr, High-Flyer Quant đã mua được hơn 10.000 bộ xử lý đồ họa Nvidia trước khi chính phủ Mỹ cấm vận chip AI với Trung Quốc. Move thông minh đó nha! Trên trang web, nhà quản lý quỹ cho biết họ chi 200 triệu nhân dân tệ và 1 tỷ nhân dân tệ (khoảng 27 triệu USD và 137 triệu USD) vào năm 2020 và 2021 để xây dựng chuỗi cụm máy tính AI Fire-Flyer.

DeepSeek V3 được phát triển với ngân sách chỉ 5,58 triệu USD trong khoảng hai tháng - chỉ bằng một phần nhỏ chi phí mà các công ty công nghệ khác đổ vào LLM. Tiết kiệm mà vẫn xịn, đúng chuẩn "ít mà chất"! ✨

Theo CGTN, Liang Wenfeng khá kín tiếng, chỉ trả lời phỏng vấn Anyong - một thương hiệu con của công ty truyền thông công nghệ thương mại 36Kr của Trung Quốc - vào năm 2023 và 2024. CGTN đã tổng hợp các trích đoạn được dịch từ các cuộc phỏng vấn này, thể hiện quan điểm của Liang về DeepSeek nói riêng và AI nói chung.

bfc63f8a1bb2962a4d28.jpg


**"Chủ nghĩa dài hạn" của DeepSeek**

Đối với Liang, DeepSeek giống như một dự án side hustle được thúc đẩy bởi sự tò mò và đam mê nghiên cứu nền tảng. Anh thừa nhận rằng nghiên cứu cơ bản thường không mang lại lợi nhuận ngay, nhưng anh bị cuốn hút bởi thách thức khám phá các lĩnh vực phức tạp như tài chính và tiềm năng của trí tuệ nhân tạo tổng hợp (AGI).

Trọng tâm của Liang là tìm hiểu bản chất trí thông minh con người và các quá trình nền tảng của nó, tin rằng khám phá này rất quan trọng dù thiếu động lực thương mại.

"Bản chất trí thông minh con người có thể là ngôn ngữ; suy nghĩ của con người có thể là một quá trình ngôn ngữ. Bạn nghĩ rằng bạn đang suy nghĩ, nhưng thực tế có thể bạn đang vận động ngôn ngữ trong tâm trí mình. Điều này ngụ ý rằng trí tuệ nhân tạo giống con người (AGI) có thể xuất hiện từ các mô hình ngôn ngữ lớn", Liang nói. Sâu sắc quá trời!

Liang và team từng thử nghiệm nhiều kịch bản và cuối cùng quyết định đi sâu vào lĩnh vực tài chính đủ phức tạp. "Đối với chúng tôi, đó là câu hỏi về cách thực hiện, không phải lý do tại sao phải thực hiện". Mindset của người làm lớn đây rồi!

**Nhân tài và xây dựng đội ngũ**

Hồ sơ LinkedIn của DeepSeek cho thấy công ty này có đội ngũ chưa đến 10 người. Một thành viên được cho là đã bị Lei Jun của Xiaomi chiêu mộ để phát triển AI vào tháng 12/2024. Team nhỏ mà chất lượng không phải bàn! ‍

Nói về tuyển dụng, Liang cho rằng nếu theo đuổi mục tiêu ngắn hạn thì thuê người có kinh nghiệm là đúng. "Nhưng về lâu dài, kinh nghiệm ít quan trọng hơn. Kỹ năng nền tảng, sự sáng tạo và niềm đam mê mới là quan trọng. Từ góc độ này, có rất nhiều ứng viên phù hợp ở Trung Quốc".

Liang cho rằng điều thu hút nhất đối với những tài năng hàng đầu là cơ hội giải quyết những thách thức khó khăn lớn nhất của thế giới. "Trên thực tế, những tài năng hàng đầu ở Trung Quốc bị đánh giá thấp. Có quá ít sự đổi mới cốt lõi ở cấp độ xã hội, vì vậy họ không được công nhận. Bằng cách làm việc với những vấn đề khó khăn nhất, chúng tôi trở nên hấp dẫn họ". Đúng là biết cách giữ người tài!

040f4fcd2155fcb8a8ea.png


Theo Fortune, Liang muốn biến DeepSeek trở thành công ty dẫn đầu trong nước về AI khi tuyển dụng nhân tài từ các trường đại học hàng đầu Trung Quốc và trả lương xịn xò ngang với các công ty công nghệ lớn như ByteDance - công ty mẹ của TikTok. Đãi ngộ tốt mới giữ được người giỏi chứ!

Liang nhận định rằng sự đổi mới thường xuất hiện tự nhiên, thay vì được lên kế hoạch hay dạy dỗ. Vì vậy, đổi mới đòi hỏi sự tự do cũng như không gian cho thử nghiệm và sai sót; còn sự can thiệp và quản lý chỉ ở mức tối thiểu. Quá trình này đôi khi có thể tốn kém và không hiệu quả.

"Do đó, chỉ khi nền kinh tế đạt đến một mức độ phát triển nhất định thì đổi mới mới có thể phát triển mạnh. Khi nguồn lực khan hiếm hoặc trong ngành công nghiệp không được thúc đẩy bởi sự đổi mới, chi phí và hiệu quả là rất quan trọng. Hãy nhìn xem, OpenAI cũng phải mất rất nhiều tiền để đạt được điều đó".

Trong các cuộc phỏng vấn, Liang nhấn mạnh nhu cầu của Trung Quốc trong việc chuyển từ bắt chước sang sáng tạo và xây dựng hệ sinh thái công nghệ riêng.

"Sự dẫn đầu của NVIDIA không chỉ là kết quả của những nỗ lực của một công ty; đó là thành tựu chung của toàn bộ cộng đồng công nghệ và ngành công nghiệp phương Tây. Họ có thể nhìn thấy thế hệ xu hướng công nghệ tiếp theo và có lộ trình.

5ea4bb402206b61e238d.png


Nguồn: kenh14.vn
 
Back
Top