Journal of ICT Research and Applications ITB Bandung Vol. 16 No. 1 2022
Automatically Detect Software Security Vulnerabilities Based on Natural Language Processing Techniques and Machine Learning Algorithms

Dublin Core

Title

Subject

machine learning algorithms; natural language processing techniques;
software security vulnerability detection; software vulnerabilities; source code features.

Description

Abstract. Nowadays, software vulnerabilities pose a serious problem, because cyber-attackers often find ways to attack a system by exploiting software vulnerabilities. Detecting software vulnerabilities can be done using two main methods: i) signature-based detection, i.e. methods based on a list of known security vulnerabilities as a basis for contrasting and comparing; ii) behavior
analysis-based detection using classification algorithms, i.e., methods based on analyzing the software code. In order to improve the ability to accurately detect software security vulnerabilities, this study proposes a new approach based on a technique of analyzing and standardizing software code and the random forest
(RF) classification algorithm. The novelty and advantages of our proposed method are that to determine abnormal behavior of functions in the software, instead of trying to define behaviors of functions, this study uses the Word2vec natural language processing model to normalize and extract features of functions. Finally, to detect security vulnerabilities in the functions, this study proposes to use a popular and effective supervised machine learning algorithm.

Creator

Cho Do Xuan, Vu Ngoc Son & Duong Duc

Source

DOI: 10.5614/itbj.ict.res.appl.2022.16.1.5

Publisher

IRCS-ITB

Date

01 Desember 2021

Contributor

Sri Wahyuni

Rights

ISSN: 2337-5787

Format

PDF

Language

English

Type

Text

Coverage

Journal of ICT Research and Applications ITB Bandung Vol. 16 No. 1 2022

Files

16905-Article Text-59312-4-10-20220713.pdf

Collection

Vol. 16 No. 1 2022

Tags

Jurnal Nasional Informatika,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon , machine learning algorithms,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon , natural language processing techniques,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon , software security vulnerability detection,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon , software vulnerabilities,Repository, Repository Horizon University Indonesia, Repository Universitas Horizon Indonesia, Horizon.ac.id, Horizon University Indonesia, Universitas Horizon Indonesia, HorizonU, Repo Horizon , source code features

Citation

Cho Do Xuan, Vu Ngoc Son & Duong Duc, “Journal of ICT Research and Applications ITB Bandung Vol. 16 No. 1 2022
Automatically Detect Software Security Vulnerabilities Based on Natural Language Processing Techniques and Machine Learning Algorithms,” Repository Horizon University Indonesia, accessed August 23, 2025, https://repository.horizon.ac.id/items/show/3444.

Journal of ICT Research and Applications ITB Bandung Vol. 16 No. 1 2022 Automatically Detect Software Security Vulnerabilities Based on Natural Language Processing Techniques and Machine Learning Algorithms

Dublin Core

Title

Subject

Description

Creator

Source

Publisher

Date

Contributor

Rights

Format

Language

Type

Coverage

Files

Collection

Tags

Citation

Journal of ICT Research and Applications ITB Bandung Vol. 16 No. 1 2022
Automatically Detect Software Security Vulnerabilities Based on Natural Language Processing Techniques and Machine Learning Algorithms