OpenAI GPT-4 sắp được phát hành. Đó là đa phương thức, có nghĩa là nếu Google không lo lắng thì nó sẽ bắt đầu ngay bây giờ

OpenAI GPT-4 sẽ ra mắt vào giữa tháng 3 năm 2023 và nó rất lớn

Giám đốc công nghệ của Microsoft Đức, Andreas Braun, đã xác nhận rằng GPT-4 sẽ ra mắt trong vòng một tuần kể từ ngày 9 tháng 3 năm 2023 và nó sẽ là đa phương thức. AI đa phương thức có nghĩa là nó sẽ có thể hoạt động trong nhiều loại đầu vào, như video, hình ảnh và âm thanh.

Mô hình ngôn ngữ lớn đa phương thức

Điểm đáng chú ý từ thông báo là GPT-4 là đa phương thức (SEJ đã dự đoán GPT-4 là đa phương thức vào tháng 1 năm 2023).

Phương thức là một tham chiếu đến loại đầu vào mà (trong trường hợp này) một mô hình ngôn ngữ lớn xử lý.

Đa phương thức có thể bao gồm văn bản, lời nói, hình ảnh và video.

GPT-3 và GPT-3.5 chỉ hoạt động ở một phương thức là văn bản.

Theo báo cáo của Đức, GPT-4 có thể hoạt động ở ít nhất bốn phương thức, hình ảnh, âm thanh (thính giác), văn bản và video.

Tiến sĩ Andreas Braun, CTO Microsoft Đức được trích dẫn:

“Chúng tôi sẽ giới thiệu GPT-4 vào tuần tới, ở đó chúng tôi sẽ có các mô hình đa phương thức cung cấp các khả năng hoàn toàn khác nhau – ví dụ như video…”

Báo cáo thiếu thông tin cụ thể về GPT-4, vì vậy không rõ liệu nội dung được chia sẻ về đa phương thức là dành riêng cho GPT-4 hay chỉ nói chung.

Giám đốc chiến lược kinh doanh của Microsoft Holger Kenn đã giải thích về đa phương thức nhưng báo cáo không rõ ràng liệu ông đang đề cập đến đa phương thức hay đa phương thức GPT-4 nói chung.

Tôi tin rằng tài liệu tham khảo của anh ấy về đa phương thức là dành riêng cho GPT-4.

Bản tin chia sẻ:

“Kenn đã giải thích AI đa phương thức là gì, thứ có thể dịch văn bản không chỉ thành hình ảnh mà còn thành âm nhạc và video.”

Một sự thật thú vị khác là Microsoft đang nghiên cứu “ chỉ số độ tin cậy ” để tạo nền tảng cho AI của họ với các dữ kiện nhằm làm cho nó đáng tin cậy hơn.

Microsoft Kosmos-1
Một điều dường như không được báo cáo đầy đủ ở Hoa Kỳ là Microsoft đã phát hành một mô hình ngôn ngữ đa phương thức có tên là Kosmos-1 vào đầu tháng 3 năm 2023.

Theo báo cáo của trang tin tức Đức, Heise.d e:

Đưa doanh nghiệp của bạn tiến lên với tiếp thị nội dung
Nâng cao khả năng hiển thị trực tuyến của bạn, tiếp cận khách hàng mới và thúc đẩy doanh số bán hàng với bộ công cụ tiếp thị nội dung tất cả trong một này.

“…nhóm đã trải qua nhiều thử nghiệm khác nhau đối với mô hình được đào tạo trước, với kết quả tốt trong việc phân loại hình ảnh, trả lời các câu hỏi về nội dung hình ảnh, tự động gắn nhãn hình ảnh, nhận dạng văn bản quang học và tác vụ tạo giọng nói.

… Suy luận trực quan, tức là rút ra kết luận về hình ảnh mà không sử dụng ngôn ngữ như một bước trung gian, dường như là chìa khóa ở đây…”

Kosmos-1 là một phương thức đa phương thức tích hợp các phương thức của văn bản và hình ảnh.

GPT-4 tiến xa hơn Kosmos-1 vì nó bổ sung phương thức thứ ba, video và dường như cũng bao gồm phương thức âm thanh.

Hoạt động trên nhiều ngôn ngữ
GPT-4 dường như hoạt động trên tất cả các ngôn ngữ. Nó được mô tả là có thể nhận câu hỏi bằng tiếng Đức và trả lời bằng tiếng Ý.

Đó là một ví dụ kỳ lạ bởi vì, ai sẽ đặt câu hỏi bằng tiếng Đức và muốn nhận được câu trả lời bằng tiếng Ý?

Đây là những gì đã được xác nhận:

“…công nghệ đã tiến xa đến mức về cơ bản nó “hoạt động với mọi ngôn ngữ”: Bạn có thể đặt câu hỏi bằng tiếng Đức và nhận câu trả lời bằng tiếng Ý.

Với tính đa phương thức, Microsoft(-OpenAI) sẽ ‘làm cho các mô hình trở nên toàn diện’.”

Tôi tin rằng điểm đột phá là mô hình vượt qua ngôn ngữ với khả năng kéo kiến ​​thức qua các ngôn ngữ khác nhau. Vì vậy, nếu câu trả lời bằng tiếng Ý thì nó sẽ biết và có thể đưa ra câu trả lời bằng ngôn ngữ mà câu hỏi được đặt ra.

Điều đó sẽ làm cho nó tương tự như mục tiêu của AI đa phương thức của Google được gọi là MUM. Mẹ được cho là có thể đưa ra câu trả lời bằng tiếng Anh mà dữ liệu chỉ tồn tại ở ngôn ngữ khác, chẳng hạn như tiếng Nhật.

Ứng dụng GPT-4

Không có thông báo hiện tại về nơi GPT-4 sẽ hiển thị. Nhưng Azure-OpenAI đã được đề cập cụ thể.

Google đang cố gắng bắt kịp Microsoft bằng cách tích hợp một công nghệ cạnh tranh vào công cụ tìm kiếm của riêng mình. Sự phát triển này càng làm trầm trọng thêm nhận thức rằng Google đang tụt lại phía sau và thiếu khả năng lãnh đạo trong lĩnh vực AI hướng tới người tiêu dùng.

Google đã tích hợp AI trong nhiều sản phẩm như Google Lens, Google Maps và các lĩnh vực khác mà người tiêu dùng tương tác với Google. Cách tiếp cận này là sử dụng AI như một công nghệ hỗ trợ, để giúp mọi người trong các nhiệm vụ nhỏ.

Cách Microsoft đang triển khai nó rõ ràng hơn và do đó, nó đang thu hút mọi sự chú ý và củng cố bức tranh về Google đang thất bại và chật vật để bắt kịp.

Đọc báo cáo gốc của Đức tại đây:

GPT-4 sẽ ra mắt vào tuần tới – và nó sẽ đa phương thức, Microsoft Đức cho biết

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *