Không quân Hoa Kỳ chắp cánh ước mơ điều khiển thiết bị điện tử bằng cử chỉ tay của nữ giảng viên Bách khoa Hà Nội
Trần Thu Trang
2023-09-20T00:07:15-04:00
2023-09-20T00:07:15-04:00
https://hust.edu.vn/vi/news/khoa-hoc-cong-nghe-dmst/khong-quan-hoa-ky-chap-canh-uoc-mo-dieu-khien-thiet-bi-dien-tu-bang-cu-chi-tay-cua-nu-giang-vien-bach-khoa-ha-noi-654853.html
https://hust.edu.vn/uploads/sys/news/2023_09/120956712_10221748900579335_4539606566139678774_n.jpg
Đại học Bách khoa Hà Nội
https://hust.edu.vn/uploads/sys/logo-dhbk-1-02_130_191.png
Thứ bảy - 09/09/2023 04:42
Trong kỷ nguyên số, công nghệ là chìa khóa vạn năng mở cánh cửa tiếp cận kiến thức, cơ hội cho mỗi người. Cũng vì vậy, chinh phục và làm chủ công nghệ luôn là giấc mơ của nhiều nhà khoa học. Với đề tài “Nhận dạng cử chỉ bàn tay sử dụng các cảm biến mang đa phương thức dựa trên tính toán biên thông minh, ứng dụng trong tương tác người máy”, được tài trợ bởi Quỹ nghiên cứu AFOSR (Văn phòng Nghiên cứu Khoa học Không quân Hoa Kỳ), PGS. Trần Thị Thanh Hải, giảng viên Trường Điện – Điện tử cùng nhóm nghiên cứu đã có những bước tiến mới trong nghiên cứu chế tạo cảm biến đeo tay đa phương thức và nhận dạng cử chỉ, ứng dụng trong tương tác người - thiết bị trong môi trường thông minh.
“Bàn tay ta làm nên tất cả”
PGS. TS. Trần Thị Thanh Hải hiện là giảng viên cao cấp, Khoa Kỹ thuật Truyền thông, đồng thời là Giám đốc Chương trình đào tạo về “Truyền thông số và Kỹ thuật đa phương tiện” (ET-E16). Được đào tạo chuyên sâu về Khoa học máy tính với ngành hẹp là Xử lý ảnh, Thị giác máy tính và Robot, sau đó được tham gia giảng dạy và nghiên cứu tại Trường Điện – Điện tử, PGS. Hải nhận thấy “ĐHBK Hà Nội đã trao cho mình những cơ hội và môi trường vô cùng quý giá để học hỏi và phát triển chuyên môn”. Trong khá nhiều các dự án, đề tài với vai trò dẫn dắt hay tham gia, PGS. Hải đã dành nhiều tâm huyết với các đề tài ứng dụng AI nhằm hiện đại hoá tương tác người – máy.
Xu thế của tương tác người - máy hiện nay và trong tương lai là ứng dụng các công nghệ cảm biến và trí tuệ nhân tạo nhằm tạo ra tương tác tự nhiên, tiệm cận với tương tác người - người. Trong số rất nhiều kênh giao tiếp, cử chỉ tay và tiếng nói hay âm thanh đã và đang thu hút được sự quan tâm của rất nhiều nhà khoa học nhằm tạo ra các công nghệ tương tác thông minh hơn. Trong xu thế này, nhóm NCS của PGS. Hải đã thực hiện đề tài “Nhận dạng cử chỉ bàn tay sử dụng các cảm biến mang đa phương thức dựa trên tính toán biên thông minh, ứng dụng trong tương tác người máy”. Đây là một đề tài nghiên cứu liên ngành dựa trên những kiến thức về cảm biến đa thể thức (hình ảnh, gia tốc, con quay hồi chuyển), xử lý tín hiệu số, trí tuệ nhân tạo và thị giác máy tính.
Các hệ thống điều khiển dựa trên cử chỉ tay sử dụng các cảm biến gắn trong môi trường (camera) thường bị giới hạn bởi không gian quan sát, chi phí lắp đặt tốn kém khi phải nhân bản ở nhiều vị trí khác nhau. Đề tài này khắc phục được hạn chế cố hữu này bằng cách thiết kế một thiết bị đa cảm biến tương tự như đồng hồ đeo tay thông minh, dễ dàng mang theo và di chuyển cùng đối tượng điều khiển ở bất kỳ vị trí nào trong môi trường. Các tín hiệu về cử chỉ và môi trường sẽ được thu thập, xử lý, và nhận dạng trên thiết bị biên đi kèm, từ đó chuyển thành các lệnh điều khiển cơ bản các thiết bị điện tử như bóng đèn, tivi, điều hoà, …. trong môi trường trong nhà. Thiết bị này giúp người dùng có thể điều khiển các thiết bị ở bất kỳ vị trí nào chỉ bằng một vài động tác đơn giản của tay, không đòi hỏi phải di chuyển hay sử dụng công tác, điều khiển từ xa.
12 cử chỉ tay thiết bị có thể nhận dạng được
Khi nghiên cứu và triển khai phương pháp nhận dạng từ cảm biến đeo thông minh, rất nhiều thách thức mới nảy sinh. “Cảm biến gắn trong môi trường thường có khả năng quan sát được toàn bộ con người và chuyển động của bàn tay, vì thế việc phân biệt cử chỉ có thể dễ dàng hơn. Tuy nhiên, cảm biến đeo tay có góc nhìn hẹp nên khó quan sát được bàn tay và nhất là không thể quan sát được quỹ đạo chuyển động của tay do tay di chuyển cùng với cảm biến”, cô Hải giải thích. Hiện nay, thiết bị đang được thử nghiệm trong phòng thí nghiệm để nhận dạng 12 cử chỉ tay ví dụ như hất tay lên là “Bật”, phẩy tay xuống là “Tắt”, gạt tay để “Chuyển trang”, vẽ tay theo vòng tròn để điều chỉnh âm lượng, …
Các đánh giá sẽ được thực hiện kỹ hơn, cùng với việc phát triển nhận dạng liên tục tín hiệu sẽ cho phép ứng dụng vào thực tế nhằm nâng cao khả năng tương tác của con người với thiết bị trong môi trường, từ đó giúp cuộc sống hiện đại và dễ dàng hơn. Khác với cảm biến âm thanh như bóng đèn bật tắt theo tiếng vỗ tay, hay “Hey siri” trên thiết bị điện tử của Apple, sản phẩm của đề tài có khả năng mở rộng để thực hiện các bài toán xa hơn như ghi lại hoạt động trong ngày hay trợ lý nhắc nhở một số thao tác trong chăm sóc sức khoẻ đối với người cao tuổi.
Dành tài trí để cống hiến cho Việt Nam
PGS. Trần Thị Thanh Hải là cựu sinh viên K41 của Đại học Bách khoa Hà Nội. Sau khi tổt nghiệp kỹ sư ngành Công nghệ thông tin, cô nhận học bổng Thạc sĩ và Tiến sĩ tại Cộng hoà Pháp. Sau đó cô tiếp tục thực hiện nghiên cứu sau tiến sĩ tại Viện nghiên cứu về khoa học máy tính và các hệ thống ngẫu nhiên (IRISA) và Viện nghiên cứu năng lượng nguyên tử và năng lượng thay thế (CEA). Hoàn thành các nghiên cứu, cô Hải trở về Việt Nam làm giảng viên của ĐHBK Hà nội. Cô tâm sự: “Làm việc ở môi trường Việt Nam có những thách thức riêng nhưng cơ hội cũng lại rất nhiều. Cơ hội được ở cạnh gia đình, cơ hội được làm việc với những cộng sự và sinh viên ưu tú, được tham gia những dự án có ý nghĩa thực tiễn với nước mình”.
Bên cạnh những nghiên cứu khoa học cơ bản, PGS. Hải cùng các cộng sự cũng hướng đến áp dụng kết quả nghiên cứu vào ứng dụng thực tiễn gắn với Việt nam trong nông nghiệp (tự động đếm số búp chè từ ảnh chụp, phân loại tự động thóc giống), trong giáo dục (phân tích tự động hành vi của sinh viên trong lớp học), trong y tế (phát hiện tự động tổn thương từ ảnh nội soi đường tiêu hoá, ảnh siêu âm buồng trứng, tiên lượng chấn thương sọ não, v.v.). Cô rất vui khi có những đóng góp nhỏ mang tính thực tiễn, giúp ích cho sự phát triển về công nghệ nói chung tại Việt Nam.
Đối với đề tài về nhận dạng cử chỉ tay, nhóm nghiên cứu được tài trợ bởi Văn phòng Nghiên cứu Khoa học Không quân Hoa Kỳ gồm cán bộ đến từ nhiều trường đại học ở Hà Nội và Đại học Toulon, cộng hoà Pháp. Theo cô Hải, việc kết nối giữa các nhà khoa học từ nhiều trường đại học khác nhau sẽ hình thành một đội ngũ cán bộ có cùng chuyên môn và đam mê nghiên cứu. “Mục tiêu của chúng tôi không chỉ là những sản phẩm mẫu, những bài báo khoa học mà còn đào tạo cán bộ, nâng cao kiến thức và tạo ra sự kết nối trong nước và quốc tế”.
Đây cũng là một trong những định hướng của Đại học Bách khoa Hà Nội: Phát huy truyền thống và thế mạnh trong hợp tác, Đại học Bách khoa Hà Nội tập trung đẩy mạnh các hoạt động hợp tác với các đối tác học thuật theo chiều sâu, nhằm đem lại các hiệu quả thiết thực cho đào tạo, nghiên cứu và phát triển nguồn lực cán bộ.
“Tôi rất hài lòng khi được làm việc tại Đại học Bách khoa Hà Nội”, PGS. Trần Thị Thanh Hải tự hào nói. Đối với cô, Bách khoa Hà Nội là một môi trường tốt để nghiên cứu và giảng dạy. Với niềm tự hào từng là sinh viên của trường, cô được chứng kiến sự chuyển mình mạnh mẽ trong công tác và thúc đẩy giảng viên nghiên cứu khoa học. Cô Hải cho rằng giảng viên Bách khoa Hà Nội được trao rất nhiều quyền tự do như: Tự do về học thuật, tự do phát triển bản thân, học hỏi để nâng cao kiến thức và kinh nghiệm.
Đề tài nghiên cứu của PGS. Hải được Quỹ nghiên cứu AFOSR (Văn phòng Nghiên cứu Khoa học Không quân Hoa Kỳ) tài trợ 60.000 USD trong 2 năm từ 2020-2022. Sau khi kết thúc, đề tài thu được nhiều kết quả, đặc biệt là có 12 xuất bản trên hội nghị và tạp chí quốc tế.
Bên cạnh đó, đề tài có một số đóng góp về khoa học như: Đề xuất phương pháp tích hợp thông tin của camera và gia tốc, chuyển động tay để nâng cao hiệu quả việc nhận dạng, đóng góp cho cộng đồng nghiên cứu một cơ sở dữ liệu. PGS. Thanh Hải nhấn mạnh: “Đối với người làm về khoa học máy tính hay trí tuệ nhân tạo, dữ liệu là vô cùng quan trọng. Nếu không có dữ liệu chia sẻ của cộng đồng nghiên cứu thì việc đi thu thập, dán nhãn cũng rất khó khăn. Bên lề những sản phẩm mình nhìn thấy được, những sản phẩm có giá trị lâu dài như cơ sở dữ liệu cũng là một đóng góp rất lớn”. |
Trần Trang