카스 1.6 다운로드

이 섹션에서는 제안된 알고리즘의 성능을 검증하기 위한 실험 결과를 소개합니다. 제안된 방법의 유효성을 검사하기 위해 제안된 알고리즘을 비교 알고리즘과 비교했습니다. 먼저 5개의 데이터 집합을 사용하여 평균 정규화된 컷과 실행 시간을 비교했습니다. 둘째, 구조 유사성의 상대 적 속도 향상 및 재사용 시간의 성능을 평가했습니다. 셋째, 시간 비교 실험을 실행하여 최적화 효과를 확인했습니다. 마지막으로, 우리는 인간넷 데이터를 사용하여 CASS에서 발견된 클러스터가 생물학적으로 중요한 기능을 가지고 있는지 확인했습니다. 위의 bf는 블룸 필터이며 e는 검사할 가장자리입니다. Google 알고리즘은 두 번째 조인 작업에 대해 키가 변경되기 전에 키-값 쌍을 필터와 필터링하므로 전체 중간 결과 수가 줄어듭니다. . 표 2에 나타낸 바와 같이, „엡실론”은 구조 유사성에 대한 임계값으로서 사용되었다. 가양성 비율은 Bloom 필터의 출력이 가양성일 확률이었습니다.

#{실행자}는 알고리즘에서 변환 및 작업을 수행한 Spark의 실행자 수입니다. 실행자가 처리한 데이터는 #{데이터 파티션}으로 나뉩니다. #{데이터 파티션}에 20을 할당했습니다. 실험 설정에서 각 실행자는 하나의 데이터 파티션을 처리했습니다. 표 3은 실험 결과에 사용된 용어를 나타낸다. „실행 시간”은 일반 실행 시간을 나타내고”재사용 시간”은 이미 계산된 구조 유사성을 재사용할 때 실행 시간을 나타냅니다. . 이 연구에서는 제안된 알고리즘의 성능을 평가하기 위해 다양한 유형의 무방향 네트워크를 사용했습니다. 이러한 네트워크의 특성은 표 1에 요약되어 있습니다.

이 섹션에서는 네트워크 크기에 따라 제안된 메서드가 요구하는 실행 시간 및 메모리 사용에 대한 지침을 제시하는 실험을 수행했습니다. 실험에서는 Erdos Renyi 모델을 사용하여 20도의 도와 10,000 ~40,960,000의 엣지 크기의 랜덤 네트워크 [24]를 생성했습니다. 실행 시간과 메모리 사용량을 측정하기 위해 4대의 컴퓨터를 사용했습니다. 메모리 사용량을 확인하기 위해 각 컴퓨터에 사용되는 평균 메모리 양을 사용했습니다. 실험 결과는 도 13에 도시되어 있다. 그림에서 x축은 네트워크의 가장자리 크기를 나타내고 y축은 각각 실행 시간 및 메모리 사용량을 나타냅니다. 결과는 네트워크의 크기가 증가하고 네트워크 크기가 증가함에 따라 실행 시간 및 메모리 사용량의 변화가 증가하는 경향이 있음을 보여줍니다. .

. 노드 수가 M이고 에지 수가 N이면 제안된 알고리즘의 총 시간 복잡성은 다음과 같습니다. 첫째, 구조 유사성을 계산하는 프로세스에는 에지 데이터와 Bloom 필터의 생성 및 검색 프로세스 간의 두 가지 조인 프로세스가 포함됩니다. 에지에 대한 두 조인 프로세스는 네트워크가 최악의 경우에 완전히 연결될 때 O(N3)의 시간 복잡성을 가지며, 블룸 필터 생성 및 검색의 시간 복잡성은 최악의 경우 O(N)이다. 다음으로, 환원 네트워크 프로세스를 수행하기 위해서는, 시간 복잡성은 O(N)이며, 이는 모든 에지에 대한 구조 유사성을 확인해야 하기 때문이다.