-
Detecting Motifs in System Call Sequences논문정리 2020. 4. 22. 17:48
System call sequences에서 pattern detecting을 진행하는 논문이다.
관련 내용을 정리한다.
motifs : 대상을 구성하는 기본 단위가 되는 무늬
Motif Tracking Algorithm(MTA)를 제시한다.이를 통해 series data 내에서 반복되는 불특정 motifs를 특정해낸다.
해당 논문은 linux kernel과 user space 사이의 low level system calls sequence 의 pattern을 찾는데 적용하였다.
이를 통해 대용량의 system call data sets을 제한된 숫자의 motifs를 통해 요약할 수 있다.
Convert Time Series T to Symbolic Representation
system call data로 이루어진 time series data를 SAX representation을 통해 compression 한다.
이 때, sliding window를 활용한 평균값으로 하나의 문자로 이루어진 기호로 변환한다.
SAX: Symbolic Aggregate approXimation. 시계열(time series) data에 대해 time window로 나누고, 차원 축소를 하여 나타내는 하나의 방법이다.
http://slideplayer.com/slide/3238820/
Generate Symbol Matrix S
위의 과정에서 생성된 symbol 문자열은 word로 정의된다. sliding window를 통해 생성된 각 word는 symbol matrix S에 입력된다.
Initialise Tracker Population to Size a
Generate Motif Candidate Matrix M from S
Match Trackers to Motif Candidates
Eliminate Unmatched Trackers
Examine T to Confirm Genuine Motif Status
Eliminate Unsuccessful Trackers
Store Motifs Found
Proliferate Matched Trackers
Mutate Matched Trackers
Memory Motif Streamlining
'논문정리' 카테고리의 다른 글
SNAPPY: Programmable Kernel-Level Policies for Containers (0) 2021.12.13 Root Cause Analysis 관련 논문 조사 (0) 2021.12.13 Hierarchical Pattern Discovery in Graphs (0) 2020.03.29 DualIso: An Algorithm for Subgraph Pattern Matching on Very Large Labeled Graphs (0) 2020.03.24 ReRep: Computational detection of repetitive sequences in genomesurvey sequences (GSS) (0) 2020.02.18