TS Lê Anh Cường đang giới thiệu về hiệu quả của đề tài.
Việc khai thác thông tin từ mạng xã hội để phục vụ các mục tiêu kinh doanh, quảng bá đã và đang được nhiều người quan tâm. Tuy nhiên, sự đa dạng về cách thể hiện cũng như nội dung từ các nguồn thông tin mạng xã hội mang lại luôn là bài toán khó đối với bất kỳ ai muốn thu thập, phân tích, tổng hợp thông tin một cách chính xác, hiệu quả nhất.
Đề tài "Phân tích xu hướng cộng đồng dựa trên mạng xã hội và ứng dụng trong du lịch, kinh doanh sản phẩm công nghệ" do TS. Lê Anh Cường và cộng sự thuộc trường Đại học Công nghệ (Đại học Quốc gia Hà Nội) triển khai sẽ góp phần giải quyết vấn đề này.
"Trung tâm" xử lý thông tin
Đề tài "Phân tích xu hướng cộng đồng dựa trên mạng xã hội và ứng dụng trong du lịch, kinh doanh sản phẩm công nghệ" do TS. Lê Anh Cường chủ trì được thực hiện với mục đích xây dựng một hệ thống xử lý tự động có khả năng thu thập thông tin từ cộng đồng mạng, phân tích, tổng hợp để đưa ra các xu hướng, quan điểm người dùng đối với một sản phẩm hay một dịch vụ nào đó. Từ đó đưa ra những nhận định, đánh giá khách quan, chính xác và tổng hợp đầy đủ các nguồn thông tin, ý kiến phục vụ công tác hoạch định chiến lược, kinh doanh. Đề tài tập trung vào 2 đối tượng: điện thoại di động và khách sạn.
Theo TS. Lê Anh Cường, trên thế giới đã có nhiều nghiên cứu cho bài toán phân tích và khai thác quan điểm như: Mỹ, Nhật, Singapore,... Tuy nhiên, cách tiếp cận và các phương pháp phát hiện vẫn có sự khác nhau phụ thuộc vào từng nét văn hóa, ngôn ngữ của mỗi nước. Do vậy đề tài hướng tới những kết quả cả về phát triển phương pháp phát hiện và xây dựng hệ thống không những đạt kết quả cao nhất tại Việt Nam mà còn có tính cạnh tranh trên thế giới.
TS. Cường cho biết thêm, một trong những vấn đề khó trong việc xác định xu hướng cộng đồng là các kỹ thuật phân tích, tổng hợp quan điểm người dùng dựa trên các bình luận là ngôn ngữ tự nhiên thông thường. Chẳng hạn, khi muốn biết xu thế của cộng đồng về một sản phẩm nào đó như Ipad, Iphone,... người ta thường phải đánh giá, bình luận đối với sản phầm là tích cực hay tiêu cực, theo từng thời điểm và tổng hợp lại. Ngoài ra hệ thống mà đề tài muốn xây dựng còn có mục tiêu cung cấp thêm nhiều thông tin tư vấn cho người dùng như đánh giá về từng thuộc tính (cấu hình) của sản phẩm, so sánh giá cả, cung cấp thông tin địa điểm.
Tối ưu hóa thông tin để phục vụ kinh doanh
TS. Lê Anh Cường cho biết, hệ thống được xây dựng và phát triển theo 3 bước cơ bản: Bước 1 là thu thập thông tin từ các nguồn mạng xã hội khác nhau. Bước 2 tiến hành phân tích nội dung để xác định trong dữ liệu văn bản, đâu là thông tin về đối tượng, thông tin thuộc tính đối tượng, và thông tin quan điểm được thể hiện thế nào. Sau đó phân loại thông tin quan điểm, tổng hợp các ý kiến, xác định xu hướng và tạo ra các tổng kết. Trong bước này có hai nội dung chính cần được nghiên cứu gồm: phân tích ngôn ngữ, phát triển và xây dựng các công cụ xử lý ngôn ngữ; phân tích và tổng hợp quan điểm, xác định xu hướng. Bước 3: xây dựng hệ thống tương tác với người dùng gồm tìm kiếm thông tin, hiển thị thông tin theo các tiêu chí và các thống kê khác nhau.
Các hệ thống hiện tại thường dưới dạng gợi ý sản phẩm đặt trọng tâm là người dùng và đưa ra gợi ý phù hợp với thói quen và sở thích trong quá khứ của người dùng, hoặc một số hệ phân tích xu hướng cho một số vấn đề tài chính, vấn đề xã hội,… Nhưng các hệ thống này thường có hạn chế về tính đa dạng của nguồn thông tin thu thập và khả năng cung cấp thông tin tổng hợp cho việc ra quyết định.
Do vậy, nhóm nghiên cứu đề tài đặt mục tiêu xây dựng những điểm khác biệt, một số điểm được coi là sự phát triển mới trên các lĩnh vực có nhu cầu sử dụng cao, có khả năng kinh doanh lớn, điều này thể hiện ở các điểm như: thu thập, phân tích quan điểm trên nhiều nguồn thông tin đa dạng; nguồn thông tin thể hiện dưới dạng ngôn ngữ tự nhiên - một trong những trọng tâm về phát triển phương pháp để tạo sự khác biệt về chất lượng...
Với sự am hiểu sâu sắc về các công nghệ xử lý ngôn ngữ tự nhiên trên cả tiếng Anh và tiếng Việt, kết quả của đề tài sẽ là tiền đề cho phát triển các miền dữ liệu khác như hỗ trợ nghiên cứu về xã hội học về quan điểm của người dùng Internet với các vấn đề kinh tế xã hội, chính trị,...; làm cơ sở để đưa ra các quyết sách kịp thời và hợp lý; phát triển kinh doanh dựa trên các tiện ích từ xã hội thông tin trên mạng Internet.