Enhanced SQL injection detection using chi-square feature selection and machine learning classifiers Article Swipe

PDF

Emanuel Casmiry , Neema Mduma , Ramadhani Sinde ·

YOU? · · 2025 · Open Access · · DOI: https://doi.org/10.3389/fdata.2025.1686479

In the face of increasing cyberattacks, Structured Query Language (SQL) injection remains one of the most common and damaging types of web threats, accounting for over 20% of global cyberattack costs. However, due to its dynamic and variable nature, the current detection methods often suffer from high false positive rates and lower accuracy. This study proposes an enhanced SQL injection detection using Chi-square feature selection (FS) and machine learning models. A combined dataset was assembled by merging a custom dataset with the SQLiV3.csv file from the Kaggle repository. A Jensen–Shannon Divergence (JSD) analysis revealed moderate domain variation (overall JSD = 0.5775), with class-wise divergence of 0.1340 for SQLi and 0.5320 for benign queries. Term Frequency-Inverse Document Frequency (TF-IDF) was used to convert SQL queries into feature vectors, followed by the Chi-square feature selection to retain the most statistically significant features. Five classifiers, namely multinomial Naïve Bayes, support vector machine, logistic regression, decision tree, and K-nearest neighbor, were tested before and after feature selection. The results reveal that Chi-square feature selection improves classification performance across all models by reducing noise and eliminating redundant features. Notably, Decision Tree and K-Nearest Neighbors (KNN) models, which initially performed poorly, showed substantial improvements after feature selection. The Decision Tree improved from being the second-worst performer before feature selection to the best classifier afterward, achieving the highest accuracy of 99.73%, precision of 99.72%, recall of 99.70%, F1-score of 99.71%, a false positive rate (FPR) of 0.25%, and a misclassification rate of 0.27%. These findings highlight the crucial role of feature selection in high-dimensional data environments. Future research will investigate how feature selection impacts deep learning architectures, adaptive feature selection, incremental learning approaches, robustness against adversarial attacks, and evaluate model transferability across production web environments to ensure real-time detection reliability, establishing feature selection as a vital step in developing reliable SQL injection detection systems.

Related Topics

Feature Selection

Computer Science

Artificial Intelligence

Decision Tree

Machine Learning

Support Vector Machine

Decision Tree Learning

Feature (Machine Learning)

Training, Validation, And Test Data Sets

Concepts

Feature selection Computer science Artificial intelligence Decision tree Machine learning Support vector machine Feature (linguistics) Classifier (UML) Logistic model tree Pattern recognition (psychology) Decision tree learning Data mining Precision and recall SQL Random forest Statistical classification Naive Bayes classifier F1 score ID3 algorithm SQL injection Word error rate Incremental decision tree False positive rate Selection (genetic algorithm) Feature vector Training set Feature extraction Information gain ratio

Metadata

Type: article
Landing Page: https://doi.org/10.3389/fdata.2025.1686479
PDF: https://public-pages-files-2025.frontiersin.org/journals/big-data/articles/10.3389/fdata.2025.1686479/pdf
OA Status: gold
References: 33
OpenAlex ID: https://openalex.org/W7106024027

All OpenAlex metadata

Raw OpenAlex JSON

OpenAlex ID: https://openalex.org/W7106024027

Canonical identifier for this work in OpenAlex
DOI: https://doi.org/10.3389/fdata.2025.1686479

Digital Object Identifier
Title: Enhanced SQL injection detection using chi-square feature selection and machine learning classifiers

Work title
Type: article

OpenAlex work type
Publication year: 2025

Year of publication
Publication date: 2025-11-19

Full publication date if available
Authors: Emanuel Casmiry, Neema Mduma, Ramadhani Sinde

List of authors in order
Landing page: https://doi.org/10.3389/fdata.2025.1686479

Publisher landing page
PDF URL: https://public-pages-files-2025.frontiersin.org/journals/big-data/articles/10.3389/fdata.2025.1686479/pdf

Direct link to full text PDF
Open access: Yes

Whether a free full text is available
OA status: gold

Open access status per OpenAlex
OA URL: https://public-pages-files-2025.frontiersin.org/journals/big-data/articles/10.3389/fdata.2025.1686479/pdf

Direct OA link when available
Concepts: Feature selection, Computer science, Artificial intelligence, Decision tree, Machine learning, Support vector machine, Feature (linguistics), Classifier (UML), Logistic model tree, Pattern recognition (psychology), Decision tree learning, Data mining, Precision and recall, SQL, Random forest, Statistical classification, Naive Bayes classifier, F1 score, ID3 algorithm, SQL injection, Word error rate, Incremental decision tree, False positive rate, Selection (genetic algorithm), Feature vector, Training set, Feature extraction, Information gain ratio

Top concepts (fields/topics) attached by OpenAlex
Cited by: 0

Total citation count in OpenAlex
References (count): 33

Number of works referenced by this work

Full payload

id	https://openalex.org/W7106024027
doi	https://doi.org/10.3389/fdata.2025.1686479
ids.doi	https://doi.org/10.3389/fdata.2025.1686479
ids.openalex	https://openalex.org/W7106024027
fwci	0.0
type	article
title	Enhanced SQL injection detection using chi-square feature selection and machine learning classifiers
biblio.issue
biblio.volume	8
biblio.last_page
biblio.first_page
topics[0].id	https://openalex.org/T12479
topics[0].field.id	https://openalex.org/fields/17
topics[0].field.display_name	Computer Science
topics[0].score	0.957112193107605
topics[0].domain.id	https://openalex.org/domains/3
topics[0].domain.display_name	Physical Sciences
topics[0].subfield.id	https://openalex.org/subfields/1710
topics[0].subfield.display_name	Information Systems
topics[0].display_name	Web Application Security Vulnerabilities
topics[1].id	https://openalex.org/T11644
topics[1].field.id	https://openalex.org/fields/17
topics[1].field.display_name	Computer Science
topics[1].score	0.0069875530898571014
topics[1].domain.id	https://openalex.org/domains/3
topics[1].domain.display_name	Physical Sciences
topics[1].subfield.id	https://openalex.org/subfields/1710
topics[1].subfield.display_name	Information Systems
topics[1].display_name	Spam and Phishing Detection
topics[2].id	https://openalex.org/T10734
topics[2].field.id	https://openalex.org/fields/17
topics[2].field.display_name	Computer Science
topics[2].score	0.003241769503802061
topics[2].domain.id	https://openalex.org/domains/3
topics[2].domain.display_name	Physical Sciences
topics[2].subfield.id	https://openalex.org/subfields/1710
topics[2].subfield.display_name	Information Systems
topics[2].display_name	Information and Cyber Security
is_xpac	False
apc_list.value	1150
apc_list.currency	USD
apc_list.value_usd	1150
apc_paid.value	1150
apc_paid.currency	USD
apc_paid.value_usd	1150
concepts[0].id	https://openalex.org/C148483581
concepts[0].level	2
concepts[0].score	0.8397799134254456
concepts[0].wikidata	https://www.wikidata.org/wiki/Q446488
concepts[0].display_name	Feature selection
concepts[1].id	https://openalex.org/C41008148
concepts[1].level	0
concepts[1].score	0.7611517906188965
concepts[1].wikidata	https://www.wikidata.org/wiki/Q21198
concepts[1].display_name	Computer science
concepts[2].id	https://openalex.org/C154945302
concepts[2].level	1
concepts[2].score	0.7333372831344604
concepts[2].wikidata	https://www.wikidata.org/wiki/Q11660
concepts[2].display_name	Artificial intelligence
concepts[3].id	https://openalex.org/C84525736
concepts[3].level	2
concepts[3].score	0.6619408130645752
concepts[3].wikidata	https://www.wikidata.org/wiki/Q831366
concepts[3].display_name	Decision tree
concepts[4].id	https://openalex.org/C119857082
concepts[4].level	1
concepts[4].score	0.6100674271583557
concepts[4].wikidata	https://www.wikidata.org/wiki/Q2539
concepts[4].display_name	Machine learning
concepts[5].id	https://openalex.org/C12267149
concepts[5].level	2
concepts[5].score	0.5597372651100159
concepts[5].wikidata	https://www.wikidata.org/wiki/Q282453
concepts[5].display_name	Support vector machine
concepts[6].id	https://openalex.org/C2776401178
concepts[6].level	2
concepts[6].score	0.513148844242096
concepts[6].wikidata	https://www.wikidata.org/wiki/Q12050496
concepts[6].display_name	Feature (linguistics)
concepts[7].id	https://openalex.org/C95623464
concepts[7].level	2
concepts[7].score	0.503244161605835
concepts[7].wikidata	https://www.wikidata.org/wiki/Q1096149
concepts[7].display_name	Classifier (UML)
concepts[8].id	https://openalex.org/C61722155
concepts[8].level	3
concepts[8].score	0.4859722852706909
concepts[8].wikidata	https://www.wikidata.org/wiki/Q6667643
concepts[8].display_name	Logistic model tree
concepts[9].id	https://openalex.org/C153180895
concepts[9].level	2
concepts[9].score	0.47919782996177673
concepts[9].wikidata	https://www.wikidata.org/wiki/Q7148389
concepts[9].display_name	Pattern recognition (psychology)
concepts[10].id	https://openalex.org/C5481197
concepts[10].level	3
concepts[10].score	0.4417472779750824
concepts[10].wikidata	https://www.wikidata.org/wiki/Q16766476
concepts[10].display_name	Decision tree learning
concepts[11].id	https://openalex.org/C124101348
concepts[11].level	1
concepts[11].score	0.4018482267856598
concepts[11].wikidata	https://www.wikidata.org/wiki/Q172491
concepts[11].display_name	Data mining
concepts[12].id	https://openalex.org/C81669768
concepts[12].level	2
concepts[12].score	0.387053906917572
concepts[12].wikidata	https://www.wikidata.org/wiki/Q2359161
concepts[12].display_name	Precision and recall
concepts[13].id	https://openalex.org/C510870499
concepts[13].level	2
concepts[13].score	0.3807693123817444
concepts[13].wikidata	https://www.wikidata.org/wiki/Q47607
concepts[13].display_name	SQL
concepts[14].id	https://openalex.org/C169258074
concepts[14].level	2
concepts[14].score	0.3518322706222534
concepts[14].wikidata	https://www.wikidata.org/wiki/Q245748
concepts[14].display_name	Random forest
concepts[15].id	https://openalex.org/C110083411
concepts[15].level	2
concepts[15].score	0.34650006890296936
concepts[15].wikidata	https://www.wikidata.org/wiki/Q1744628
concepts[15].display_name	Statistical classification
concepts[16].id	https://openalex.org/C52001869
concepts[16].level	3
concepts[16].score	0.33049947023391724
concepts[16].wikidata	https://www.wikidata.org/wiki/Q812530
concepts[16].display_name	Naive Bayes classifier
concepts[17].id	https://openalex.org/C148524875
concepts[17].level	2
concepts[17].score	0.3198670446872711
concepts[17].wikidata	https://www.wikidata.org/wiki/Q6975395
concepts[17].display_name	F1 score
concepts[18].id	https://openalex.org/C183931066
concepts[18].level	5
concepts[18].score	0.306819885969162
concepts[18].wikidata	https://www.wikidata.org/wiki/Q1653378
concepts[18].display_name	ID3 algorithm
concepts[19].id	https://openalex.org/C150451098
concepts[19].level	5
concepts[19].score	0.2949569821357727
concepts[19].wikidata	https://www.wikidata.org/wiki/Q506059
concepts[19].display_name	SQL injection
concepts[20].id	https://openalex.org/C40969351
concepts[20].level	2
concepts[20].score	0.29117077589035034
concepts[20].wikidata	https://www.wikidata.org/wiki/Q3516228
concepts[20].display_name	Word error rate
concepts[21].id	https://openalex.org/C10229987
concepts[21].level	4
concepts[21].score	0.28523972630500793
concepts[21].wikidata	https://www.wikidata.org/wiki/Q17083028
concepts[21].display_name	Incremental decision tree
concepts[22].id	https://openalex.org/C95922358
concepts[22].level	2
concepts[22].score	0.276632696390152
concepts[22].wikidata	https://www.wikidata.org/wiki/Q5432725
concepts[22].display_name	False positive rate
concepts[23].id	https://openalex.org/C81917197
concepts[23].level	2
concepts[23].score	0.2755894362926483
concepts[23].wikidata	https://www.wikidata.org/wiki/Q628760
concepts[23].display_name	Selection (genetic algorithm)
concepts[24].id	https://openalex.org/C83665646
concepts[24].level	2
concepts[24].score	0.2723589539527893
concepts[24].wikidata	https://www.wikidata.org/wiki/Q42139305
concepts[24].display_name	Feature vector
concepts[25].id	https://openalex.org/C51632099
concepts[25].level	2
concepts[25].score	0.26874926686286926
concepts[25].wikidata	https://www.wikidata.org/wiki/Q3985153
concepts[25].display_name	Training set
concepts[26].id	https://openalex.org/C52622490
concepts[26].level	2
concepts[26].score	0.2629074454307556
concepts[26].wikidata	https://www.wikidata.org/wiki/Q1026626
concepts[26].display_name	Feature extraction
concepts[27].id	https://openalex.org/C202185110
concepts[27].level	3
concepts[27].score	0.2546786963939667
concepts[27].wikidata	https://www.wikidata.org/wiki/Q6031086
concepts[27].display_name	Information gain ratio
keywords[0].id	https://openalex.org/keywords/feature-selection
keywords[0].score	0.8397799134254456
keywords[0].display_name	Feature selection
keywords[1].id	https://openalex.org/keywords/decision-tree
keywords[1].score	0.6619408130645752
keywords[1].display_name	Decision tree
keywords[2].id	https://openalex.org/keywords/support-vector-machine
keywords[2].score	0.5597372651100159
keywords[2].display_name	Support vector machine
keywords[3].id	https://openalex.org/keywords/feature
keywords[3].score	0.513148844242096
keywords[3].display_name	Feature (linguistics)
keywords[4].id	https://openalex.org/keywords/classifier
keywords[4].score	0.503244161605835
keywords[4].display_name	Classifier (UML)
keywords[5].id	https://openalex.org/keywords/logistic-model-tree
keywords[5].score	0.4859722852706909
keywords[5].display_name	Logistic model tree
keywords[6].id	https://openalex.org/keywords/pattern-recognition
keywords[6].score	0.47919782996177673
keywords[6].display_name	Pattern recognition (psychology)
keywords[7].id	https://openalex.org/keywords/decision-tree-learning
keywords[7].score	0.4417472779750824
keywords[7].display_name	Decision tree learning
keywords[8].id	https://openalex.org/keywords/precision-and-recall
keywords[8].score	0.387053906917572
keywords[8].display_name	Precision and recall
language
locations[0].id	doi:10.3389/fdata.2025.1686479
locations[0].is_oa	True
locations[0].source.id	https://openalex.org/S4210201220
locations[0].source.issn	2624-909X
locations[0].source.type	journal
locations[0].source.is_oa	True
locations[0].source.issn_l	2624-909X
locations[0].source.is_core	True
locations[0].source.is_in_doaj	True
locations[0].source.display_name	Frontiers in Big Data
locations[0].source.host_organization	https://openalex.org/P4310320527
locations[0].source.host_organization_name	Frontiers Media
locations[0].source.host_organization_lineage	https://openalex.org/P4310320527
locations[0].license	cc-by
locations[0].pdf_url	https://public-pages-files-2025.frontiersin.org/journals/big-data/articles/10.3389/fdata.2025.1686479/pdf
locations[0].version	publishedVersion
locations[0].raw_type	journal-article
locations[0].license_id	https://openalex.org/licenses/cc-by
locations[0].is_accepted	True
locations[0].is_published	True
locations[0].raw_source_name	Frontiers in Big Data
locations[0].landing_page_url	https://doi.org/10.3389/fdata.2025.1686479
indexed_in	crossref, doaj
authorships[0].author.id
authorships[0].author.orcid
authorships[0].author.display_name	Emanuel Casmiry
authorships[0].countries	TZ
authorships[0].affiliations[0].institution_ids	https://openalex.org/I97231232
authorships[0].affiliations[0].raw_affiliation_string	Computational and Communication Science and Engineering (CoCSE), The Nelson Mandela African Institution of Science and Technology (NM-AIST), Arusha, Tanzania
authorships[0].institutions[0].id	https://openalex.org/I97231232
authorships[0].institutions[0].ror	https://ror.org/https://ror.org/041vsn055
authorships[0].institutions[0].type	education
authorships[0].institutions[0].lineage	https://openalex.org/I97231232
authorships[0].institutions[0].country_code	TZ
authorships[0].institutions[0].display_name	Nelson Mandela African Institution of Science and Technology
authorships[0].author_position	first
authorships[0].raw_author_name	Emanuel Casmiry
authorships[0].is_corresponding	True
authorships[0].raw_affiliation_strings	Computational and Communication Science and Engineering (CoCSE), The Nelson Mandela African Institution of Science and Technology (NM-AIST), Arusha, Tanzania
authorships[1].author.id	https://openalex.org/A2655253763
authorships[1].author.orcid	https://orcid.org/0000-0002-4364-3124
authorships[1].author.display_name	Neema Mduma
authorships[1].countries	TZ
authorships[1].affiliations[0].institution_ids	https://openalex.org/I97231232
authorships[1].affiliations[0].raw_affiliation_string	Computational and Communication Science and Engineering (CoCSE), The Nelson Mandela African Institution of Science and Technology (NM-AIST), Arusha, Tanzania
authorships[1].institutions[0].id	https://openalex.org/I97231232
authorships[1].institutions[0].ror	https://ror.org/https://ror.org/041vsn055
authorships[1].institutions[0].type	education
authorships[1].institutions[0].lineage	https://openalex.org/I97231232
authorships[1].institutions[0].country_code	TZ
authorships[1].institutions[0].display_name	Nelson Mandela African Institution of Science and Technology
authorships[1].author_position	middle
authorships[1].raw_author_name	Neema Mduma
authorships[1].is_corresponding	False
authorships[1].raw_affiliation_strings	Computational and Communication Science and Engineering (CoCSE), The Nelson Mandela African Institution of Science and Technology (NM-AIST), Arusha, Tanzania
authorships[2].author.id	https://openalex.org/A1494089087
authorships[2].author.orcid	https://orcid.org/0000-0001-8993-0332
authorships[2].author.display_name	Ramadhani Sinde
authorships[2].countries	TZ
authorships[2].affiliations[0].institution_ids	https://openalex.org/I97231232
authorships[2].affiliations[0].raw_affiliation_string	Computational and Communication Science and Engineering (CoCSE), The Nelson Mandela African Institution of Science and Technology (NM-AIST), Arusha, Tanzania
authorships[2].institutions[0].id	https://openalex.org/I97231232
authorships[2].institutions[0].ror	https://ror.org/https://ror.org/041vsn055
authorships[2].institutions[0].type	education
authorships[2].institutions[0].lineage	https://openalex.org/I97231232
authorships[2].institutions[0].country_code	TZ
authorships[2].institutions[0].display_name	Nelson Mandela African Institution of Science and Technology
authorships[2].author_position	last
authorships[2].raw_author_name	Ramadhani Sinde
authorships[2].is_corresponding	False
authorships[2].raw_affiliation_strings	Computational and Communication Science and Engineering (CoCSE), The Nelson Mandela African Institution of Science and Technology (NM-AIST), Arusha, Tanzania
has_content.pdf	True
has_content.grobid_xml	False
is_paratext	False
open_access.is_oa	True
open_access.oa_url	https://public-pages-files-2025.frontiersin.org/journals/big-data/articles/10.3389/fdata.2025.1686479/pdf
open_access.oa_status	gold
open_access.any_repository_has_fulltext	False
created_date	2025-11-19T00:00:00
display_name	Enhanced SQL injection detection using chi-square feature selection and machine learning classifiers
has_fulltext	False
is_retracted	False
updated_date	2025-11-20T23:13:51.555489
primary_topic.id	https://openalex.org/T12479
primary_topic.field.id	https://openalex.org/fields/17
primary_topic.field.display_name	Computer Science
primary_topic.score	0.957112193107605
primary_topic.domain.id	https://openalex.org/domains/3
primary_topic.domain.display_name	Physical Sciences
primary_topic.subfield.id	https://openalex.org/subfields/1710
primary_topic.subfield.display_name	Information Systems
primary_topic.display_name	Web Application Security Vulnerabilities
cited_by_count	0
locations_count	1
best_oa_location.id	doi:10.3389/fdata.2025.1686479
best_oa_location.is_oa	True
best_oa_location.source.id	https://openalex.org/S4210201220
best_oa_location.source.issn	2624-909X
best_oa_location.source.type	journal
best_oa_location.source.is_oa	True
best_oa_location.source.issn_l	2624-909X
best_oa_location.source.is_core	True
best_oa_location.source.is_in_doaj	True
best_oa_location.source.display_name	Frontiers in Big Data
best_oa_location.source.host_organization	https://openalex.org/P4310320527
best_oa_location.source.host_organization_name	Frontiers Media
best_oa_location.source.host_organization_lineage	https://openalex.org/P4310320527
best_oa_location.license	cc-by
best_oa_location.pdf_url	https://public-pages-files-2025.frontiersin.org/journals/big-data/articles/10.3389/fdata.2025.1686479/pdf
best_oa_location.version	publishedVersion
best_oa_location.raw_type	journal-article
best_oa_location.license_id	https://openalex.org/licenses/cc-by
best_oa_location.is_accepted	True
best_oa_location.is_published	True
best_oa_location.raw_source_name	Frontiers in Big Data
best_oa_location.landing_page_url	https://doi.org/10.3389/fdata.2025.1686479
primary_location.id	doi:10.3389/fdata.2025.1686479
primary_location.is_oa	True
primary_location.source.id	https://openalex.org/S4210201220
primary_location.source.issn	2624-909X
primary_location.source.type	journal
primary_location.source.is_oa	True
primary_location.source.issn_l	2624-909X
primary_location.source.is_core	True
primary_location.source.is_in_doaj	True
primary_location.source.display_name	Frontiers in Big Data
primary_location.source.host_organization	https://openalex.org/P4310320527
primary_location.source.host_organization_name	Frontiers Media
primary_location.source.host_organization_lineage	https://openalex.org/P4310320527
primary_location.license	cc-by
primary_location.pdf_url	https://public-pages-files-2025.frontiersin.org/journals/big-data/articles/10.3389/fdata.2025.1686479/pdf
primary_location.version	publishedVersion
primary_location.raw_type	journal-article
primary_location.license_id	https://openalex.org/licenses/cc-by
primary_location.is_accepted	True
primary_location.is_published	True
primary_location.raw_source_name	Frontiers in Big Data
primary_location.landing_page_url	https://doi.org/10.3389/fdata.2025.1686479
publication_date	2025-11-19
publication_year	2025
referenced_works	https://openalex.org/W4391725253, https://openalex.org/W2916820140, https://openalex.org/W3090559234, https://openalex.org/W4385363299, https://openalex.org/W4392192782, https://openalex.org/W4386645116, https://openalex.org/W4385951147, https://openalex.org/W4385336666, https://openalex.org/W3127152433, https://openalex.org/W1976383745, https://openalex.org/W4313561542, https://openalex.org/W2800318991, https://openalex.org/W2275092079, https://openalex.org/W3217411715, https://openalex.org/W3200915317, https://openalex.org/W4320525735, https://openalex.org/W2324869905, https://openalex.org/W4213318584, https://openalex.org/W4391006262, https://openalex.org/W2978612193, https://openalex.org/W4394012113, https://openalex.org/W4386041954, https://openalex.org/W4402084085, https://openalex.org/W3108238044, https://openalex.org/W4231230630, https://openalex.org/W4408357631, https://openalex.org/W4390659426, https://openalex.org/W4406261022, https://openalex.org/W4400349441, https://openalex.org/W4389076563, https://openalex.org/W4293029345, https://openalex.org/W4402615160, https://openalex.org/W4221127083
referenced_works_count	33
abstract_inverted_index.=	99
abstract_inverted_index.A	70, 88
abstract_inverted_index.a	77, 233, 241, 297
abstract_inverted_index.In	0
abstract_inverted_index.an	56
abstract_inverted_index.as	296
abstract_inverted_index.by	75, 128, 176
abstract_inverted_index.in	255, 300
abstract_inverted_index.of	3, 13, 20, 27, 104, 222, 225, 228, 231, 238, 244, 252
abstract_inverted_index.to	33, 120, 133, 213, 288
abstract_inverted_index.20%	26
abstract_inverted_index.JSD	98
abstract_inverted_index.SQL	58, 122, 303
abstract_inverted_index.The	163, 201
abstract_inverted_index.all	174
abstract_inverted_index.and	17, 36, 50, 66, 108, 153, 159, 179, 186, 240, 280
abstract_inverted_index.due	32
abstract_inverted_index.for	24, 106, 110
abstract_inverted_index.how	263
abstract_inverted_index.its	34
abstract_inverted_index.one	12
abstract_inverted_index.the	1, 14, 39, 81, 85, 129, 135, 207, 214, 219, 249
abstract_inverted_index.was	73, 118
abstract_inverted_index.web	21, 286
abstract_inverted_index.(FS)	65
abstract_inverted_index.Five	140
abstract_inverted_index.SQLi	107
abstract_inverted_index.Term	113
abstract_inverted_index.This	53
abstract_inverted_index.Tree	185, 203
abstract_inverted_index.best	215
abstract_inverted_index.data	257
abstract_inverted_index.deep	267
abstract_inverted_index.face	2
abstract_inverted_index.file	83
abstract_inverted_index.from	45, 84, 205
abstract_inverted_index.high	46
abstract_inverted_index.into	124
abstract_inverted_index.most	15, 136
abstract_inverted_index.over	25
abstract_inverted_index.rate	236, 243
abstract_inverted_index.role	251
abstract_inverted_index.step	299
abstract_inverted_index.that	166
abstract_inverted_index.used	119
abstract_inverted_index.were	156
abstract_inverted_index.will	261
abstract_inverted_index.with	80, 101
abstract_inverted_index.(FPR)	237
abstract_inverted_index.(JSD)	91
abstract_inverted_index.(KNN)	189
abstract_inverted_index.(SQL)	9
abstract_inverted_index.Query	7
abstract_inverted_index.These	246
abstract_inverted_index.after	160, 198
abstract_inverted_index.being	206
abstract_inverted_index.false	47, 234
abstract_inverted_index.lower	51
abstract_inverted_index.model	282
abstract_inverted_index.noise	178
abstract_inverted_index.often	43
abstract_inverted_index.rates	49
abstract_inverted_index.study	54
abstract_inverted_index.tree,	152
abstract_inverted_index.types	19
abstract_inverted_index.using	61
abstract_inverted_index.vital	298
abstract_inverted_index.which	191
abstract_inverted_index.0.1340	105
abstract_inverted_index.0.25%,	239
abstract_inverted_index.0.27%.	245
abstract_inverted_index.0.5320	109
abstract_inverted_index.Bayes,	145
abstract_inverted_index.Future	259
abstract_inverted_index.Kaggle	86
abstract_inverted_index.Naïve	144
abstract_inverted_index.across	173, 284
abstract_inverted_index.before	158, 210
abstract_inverted_index.benign	111
abstract_inverted_index.common	16
abstract_inverted_index.costs.	30
abstract_inverted_index.custom	78
abstract_inverted_index.domain	95
abstract_inverted_index.ensure	289
abstract_inverted_index.global	28
abstract_inverted_index.models	175
abstract_inverted_index.namely	142
abstract_inverted_index.recall	227
abstract_inverted_index.retain	134
abstract_inverted_index.reveal	165
abstract_inverted_index.showed	195
abstract_inverted_index.suffer	44
abstract_inverted_index.tested	157
abstract_inverted_index.vector	147
abstract_inverted_index.99.70%,	229
abstract_inverted_index.99.71%,	232
abstract_inverted_index.99.72%,	226
abstract_inverted_index.99.73%,	223
abstract_inverted_index.against	277
abstract_inverted_index.convert	121
abstract_inverted_index.crucial	250
abstract_inverted_index.current	40
abstract_inverted_index.dataset	72, 79
abstract_inverted_index.dynamic	35
abstract_inverted_index.feature	63, 125, 131, 161, 168, 199, 211, 253, 264, 271, 294
abstract_inverted_index.highest	220
abstract_inverted_index.impacts	266
abstract_inverted_index.machine	67
abstract_inverted_index.merging	76
abstract_inverted_index.methods	42
abstract_inverted_index.models,	190
abstract_inverted_index.models.	69
abstract_inverted_index.nature,	38
abstract_inverted_index.poorly,	194
abstract_inverted_index.queries	123
abstract_inverted_index.remains	11
abstract_inverted_index.results	164
abstract_inverted_index.support	146
abstract_inverted_index.(TF-IDF)	117
abstract_inverted_index.(overall	97
abstract_inverted_index.0.5775),	100
abstract_inverted_index.Decision	184, 202
abstract_inverted_index.Document	115
abstract_inverted_index.F1-score	230
abstract_inverted_index.However,	31
abstract_inverted_index.Language	8
abstract_inverted_index.Notably,	183
abstract_inverted_index.accuracy	221
abstract_inverted_index.adaptive	270
abstract_inverted_index.analysis	92
abstract_inverted_index.attacks,	279
abstract_inverted_index.combined	71
abstract_inverted_index.damaging	18
abstract_inverted_index.decision	151
abstract_inverted_index.enhanced	57
abstract_inverted_index.evaluate	281
abstract_inverted_index.findings	247
abstract_inverted_index.followed	127
abstract_inverted_index.improved	204
abstract_inverted_index.improves	170
abstract_inverted_index.learning	68, 268, 274
abstract_inverted_index.logistic	149
abstract_inverted_index.machine,	148
abstract_inverted_index.moderate	94
abstract_inverted_index.positive	48, 235
abstract_inverted_index.proposes	55
abstract_inverted_index.queries.	112
abstract_inverted_index.reducing	177
abstract_inverted_index.reliable	302
abstract_inverted_index.research	260
abstract_inverted_index.revealed	93
abstract_inverted_index.systems.	306
abstract_inverted_index.threats,	22
abstract_inverted_index.variable	37
abstract_inverted_index.vectors,	126
abstract_inverted_index.Frequency	116
abstract_inverted_index.K-Nearest	187
abstract_inverted_index.K-nearest	154
abstract_inverted_index.Neighbors	188
abstract_inverted_index.accuracy.	52
abstract_inverted_index.achieving	218
abstract_inverted_index.assembled	74
abstract_inverted_index.detection	41, 60, 291, 305
abstract_inverted_index.features.	139, 182
abstract_inverted_index.highlight	248
abstract_inverted_index.initially	192
abstract_inverted_index.injection	10, 59, 304
abstract_inverted_index.neighbor,	155
abstract_inverted_index.performed	193
abstract_inverted_index.performer	209
abstract_inverted_index.precision	224
abstract_inverted_index.real-time	290
abstract_inverted_index.redundant	181
abstract_inverted_index.selection	64, 132, 169, 212, 254, 265, 295
abstract_inverted_index.variation	96
abstract_inverted_index.Chi-square	62, 130, 167
abstract_inverted_index.Divergence	90
abstract_inverted_index.SQLiV3.csv	82
abstract_inverted_index.Structured	6
abstract_inverted_index.accounting	23
abstract_inverted_index.afterward,	217
abstract_inverted_index.class-wise	102
abstract_inverted_index.classifier	216
abstract_inverted_index.developing	301
abstract_inverted_index.divergence	103
abstract_inverted_index.increasing	4
abstract_inverted_index.production	285
abstract_inverted_index.robustness	276
abstract_inverted_index.selection,	272
abstract_inverted_index.selection.	162, 200
abstract_inverted_index.adversarial	278
abstract_inverted_index.approaches,	275
abstract_inverted_index.cyberattack	29
abstract_inverted_index.eliminating	180
abstract_inverted_index.incremental	273
abstract_inverted_index.investigate	262
abstract_inverted_index.multinomial	143
abstract_inverted_index.performance	172
abstract_inverted_index.regression,	150
abstract_inverted_index.repository.	87
abstract_inverted_index.significant	138
abstract_inverted_index.substantial	196
abstract_inverted_index.classifiers,	141
abstract_inverted_index.environments	287
abstract_inverted_index.establishing	293
abstract_inverted_index.improvements	197
abstract_inverted_index.reliability,	292
abstract_inverted_index.second-worst	208
abstract_inverted_index.cyberattacks,	5
abstract_inverted_index.environments.	258
abstract_inverted_index.statistically	137
abstract_inverted_index.architectures,	269
abstract_inverted_index.classification	171
abstract_inverted_index.transferability	283
abstract_inverted_index.Jensen–Shannon	89
abstract_inverted_index.high-dimensional	256
abstract_inverted_index.Frequency-Inverse	114
abstract_inverted_index.misclassification	242
cited_by_percentile_year
countries_distinct_count	1
institutions_distinct_count	3
citation_normalized_percentile.value	0.9152355
citation_normalized_percentile.is_in_top_1_percent	False
citation_normalized_percentile.is_in_top_10_percent	True