IT高管会(ITGGH13)
----与一群浪漫而有头脑 的IT高管偕行 ,一同分享那些有代价 、故意 思的观点和事!不一样的人生,不一样的奇迹 ,咱们的IT高管社区 。相助 接洽 :
caocy@yeah.net
IT高管会-2017年度中国最佳IT互联网产物 奖参选产物 保举
一、互联网安全保密形势分析
1.1互联网公众平台的泄密风险
随着我国信息化建立 的快速推进和当代 信息技能 的遍及 应用 ,互联网公众平台(流派 网站、微信公众号 、微博等)日益成为构造 单位 及奇迹 单位 信息公开的一个紧张 渠道。据工业和信息化部统计数据,2014年中心 部委互联网公众平台的遍及 率到达 99.1%,省市构造 单位 及奇迹 单位 互联网公众平台遍及 率到达 100%,地市级构造 单位 及奇迹 单位 互联网公众平台遍及 率到达 98%。
“网络”已成为互联网期间 保密单位 关注泄密举动 发生的新型战地 。互联网期间 的“网络 ”是构造 单位 及奇迹 单位 与大众 沟通的桥梁。法规、政令、文件、规范及服务 规范等文件通过网络向公众公示 ,公众随时通过网络来访问这些公开资源。因此对当局 、奇迹 单位 、协会及社团、国企等网络公示的信息举行 涉密巡查就尤为紧张 。一旦有泄密举动 的发生,由于网络传播 速率 快 、传播 面广的特性 ,将会造成大面积的泄密 ,造成严峻 影响 。比年 来各级党政构造 、奇迹 单位 流派 网站非法披露国家机密 信息变乱 呈上升趋势,在泄密变乱 中所占比例也敏捷 攀升,互联网涉密信息巡查成为了保密单位 的紧张 任务 。
二、1510互联网信息审计服务
2.1服务概述
2016年国家保密局再次针对互联网信息保密查抄 下发《关于构造 开展互联网流派 网站等保密查抄 的关照 》要求 ,对流派 网站及微博 、微信公众号等互联网平台内容举行 全面搜刮 排查,及时 发现泄密隐患。濡晖科技自创建 以来不停 致力于互联网泄密防护技能 的研究工作,并于2015年乐成 在国家保密局立项 ,作为互联网泄密防护工作的领跑单位 ,濡晖科技为共同 互联网信息保密巡查工作的开展,特定制了“互联网信息查抄 服务” ,服务的原理是利用 成熟的互联网爬虫技能 ,连合 权势巨子 关键字数据库的检索及濡晖大数据体系 的分析,终极 出现 给用户结果 ,提交给用户互联网数据保密分析陈诉 。
2.2服务方式
1.两边 签订 网站检测协议 ,规定网站检测内容、时间、频率等;
2.用户提供网络链接(包罗 流派 网站链接地点 ,微信 、微博链接地点 )梳理网站二级域名与构造 布局 的关系,确定是否必要 独立建模;
3.在网络爬虫技能 的底子 上 ,通过对互联网数据内容举行 4个步调 的分析筛选,终极 得到高度疑似涉密的内容,提交用户考核 处理 惩罚 。如下图所示:
D类疑似:通过1510云检测平台 ,加载“底子 战略 库”(关键字分析)查抄 后的页面数量 ;
C类疑似:通过1510云检测平台,加载“行文特性 库 ”(行文格式分析)查抄 后的页面数量 ;
B类疑似:通过1510云检测平台,举行 “1510大数据体系 联动”(大数据分析)查抄 后的页面数量 ;
A类疑似;将B类页面颠末 人工检测后的结果 提交复审员 ,复审员检测后依然以为 存在较大涉密风险的页面,该部分 为提交单位 保密办人工考核 的页面。
2.3服务特色
2.3.1方便快捷
用户无需摆设 任何体系 ,只必要 提供查抄 链接 ,克制 因摆设 体系 导致查抄 周期长、扳连 部分 广、预算不敷 用等题目 。用户提供链接后北京濡晖科技有限公司将在5-10个工作日完成查抄 ,并出具检测陈诉 。
2.3.2.明白 查抄 范围
用户只需提供网站的一级链接,1510数据抓取服务器将主动 辨认 并抓取一级链接下的全部 二级链接,对于网站中的第三方链接则不举行 抓取和分析 ,克制 导致因第三方链接出现的涉密信息追责至本单位 。
2.3.3正确 查抄 内容
1510互联网泄密防控(过后 审计服务)在举行 数据分析时采取 了4个步调 逐层举行 筛选,在数据分的4个步调 中利用 了教诲 部授权的底子 战略 库,还利用 行文组合分析等技能 对文章的行文格式与文章性子 等举行 全面的分析与鉴别 ,末了 步调 更是采取 人工检测的方式将误报率降到最低 。
2.3.4可视化陈诉
1510互联网泄密防控(过后 审计服务)的终极 交付物为可视化的检测陈诉 ,检测陈诉 中罗列 了此次查抄 服务的具体 内容,包罗 此次查抄 的全部 数据统计;D类C类B类A类分析后的数据统计;数据的种别 (如:发文类 、维稳类、舆论氛围、对外宣传等);此次查抄 的范围(一级链接下的全部 二级链接 ,包罗 :职能部分 网站、院系网站 、直属机构网站、研究中心 网站等);以及全部 A类B类C类页面的链接。
2.3.5权势巨子 战略 库体系
“1510互联网信息审计服务”在内容审计分析时不但 利用 了权势巨子 关键字战略 库(此战略 库为2015年国家局立项时的产出物)做为涉密内容分析的基准,在颠末 战略 库过滤之后还将利用 行文格式分析技能 ,分析行文格式 ,仰面 、末了 等,这些行文布局 在我们的一样平常 生存 中是少少 碰到 的,因此我们利用 独特的算法将关键字库和行文布局 举行 组合分析 ,终极 确定内容是否涉密。濡晖战略 库体系 还利用 了语义特性 分析技能 ,抽取文件片断 举行 语义分析并利用 算法解释 特性 。
2.3.6人工考核 6大原则
有无明白 的密级标识
是否同时与底子 库/高位库匹配乐成
是否由涉密单位 签发
是否具有很强的时效性或变乱 敏感性
是否具有专业的分类
针对对象是否具有涉密属性 、管理举动 是否具有保密倾向
在人工考核 页面的过程中,凡是符合以上6条考核 原则的页面,都将归为A类疑似页面。
2.4用户案例
1510互联网信息审计服务是如今 应用最广泛的互联网保密查抄 体系 ,检测了十余家单位 的上千个域名和近百个微博、微信公众号,检测页面总数高出 2000万,已经举行 查抄 的高校包罗 :
北京大学
清华大学
北京邮电大学
北京科技大学
北京林业大学
南开大学
天津大学
中国石油大学
中国矿业大学(北京)
北京语言大学
华南理工大学
中南大学
东华大学
国家开放大学
教诲 部学位与研究生教诲 发展中心
中国教诲 电视台
教诲 科学出书 社
中国教诲 科学研究院
三、1510大数据联动
1510大数据联动阐明 :
当用户担当 互联网信息审计服务时 ,检测引擎会网络 用户指定的链接数据,然后将数据传送给1510大数据引擎举行 数据分析。
1510大数据分析体系 在颠末 关键字检测 、行文格式分析、语义特性 分析后将分析结果 记入汗青 数据库,并将人为检察 的结果 天生 检测陈诉 提交用户考核 。
当用户利用 1510检测产物 举行 数据检测 ,当检测到疑似涉密数据时,1510检测产物 会将疑似涉密数据上报至1510大数据引擎;
1510大数据引擎会与本身 的汗青 数据库(汗青 数据库中为以往疑似涉密数据但经人为查抄 为不涉密的数据)举行 比对,假如 比对乐成 则为非密数据 ,返回“检测通过”信息给1510检测产物 ,1510检测产物 则将该数据视为非密数据可发布至互联网 。
假如 疑似涉密数据与1510大数据引擎比对不乐成 ,则会进入呆板 学习阶段(即通过语义分析等抽取特性 值) ,末了 通过人为考核 确定疑似涉密数据是否涉密,假如 数据不涉密则将该数据参加 汗青 数据库。
通过长时间呆板 学习,实现文档主动 分析;通过设置阀值的方法,举行 人为干预 ,不绝 进步 辨认 正确 率。
四、教诲 部案例阐明
1 、查抄 环境 概览
1、查抄 数量 。据统计,此次共抓取教诲 部当局 网站、微博 、微信公众号平台的数据页面共计179448个,此中 教诲 部当局 网站页面175468个 ,“微言教诲 ”微信号页面664个,新浪微博号“微言教诲 ”页面1065个,腾讯微博号“微言教诲 ”页面987个 ,搜狐微博号“微言教诲 ”页面975个,本日 头条“微言教诲 ”页面289个(具体 数字见附表)。
2、检测结果 。通过检测平台共发现疑似页面11373个,经多层人工筛查 ,确定疑似文档29个,经复核后重点锁定疑似文档1个,经教诲 部保密办考核 确认不属于涉密文档 。团体 来看 ,教诲 部分 户网站及微信、微博公众号互联网平台未发现违规登载 发布涉密及敏感文件信息征象 ,符合互联网保密要求。
2、查抄 方法
采取 检测平台初查与人工复查相连合 的方式,对平台检测发现的疑似文档,通过4层筛查 ,渐渐 打扫 误报数据,缩小疑似文件范围,将无法判定 的文档提交保密办举行 终审。
通过检测平台加载“教诲 部底子 战略 库” ,经体系 主动 检测分析后开端 得到C类疑似结果 11373个 。此中 涉及最多的关键词分别是:下发文件类(7572条) 、中办发文类(3527条)、头脑 政治工作(2392条)、对外宣传类(1032条) 、维稳(843条)、舆论氛围(550条)、信访类(209条)。
3 、附表
教诲 部网站www.moe.edu.cn及微博、微信公众号检测信息汇总
检测条目
页面总数量
D类疑似
C类疑似
B类疑似
A类疑似
教诲 部网站
175,468篇
11,322篇
6010篇
29篇
1篇
微信号“微言教诲 ”
664篇
20篇
9篇
0篇
0篇
新浪微博号“微言教诲 ”
1065篇
9篇
7篇
0篇
0篇
腾讯微博号“微言教诲 ”
987篇
8篇
7篇
0篇
0篇
搜狐微博号“微言教诲 ”
975篇
8篇
7篇
0篇
0篇
本日 头条“微言教诲 ”
289篇
6篇
2篇
0篇
0篇
统计
179,448篇
11,373篇
(6.34%)
6042篇
(3.37%)
29篇
(0.016%)
1篇
五、技能 支持
4.1 电子邮件技能 支持
您没有碰到 题目 的办理 方法时,请给我们发送电子邮件,邮件中请注明您的产物 序列号 、产物 版本、操纵 体系 范例 、具体 的题目 形貌 和其他相干 信息。邮件地点 :support@ruhuitec.com
4.2 电话技能 支持
欢迎 致电咨询或探究 您碰到 的题目 以及网络检测分析团体 办理 方案 ,除节沐日 外,每天 上午9点到下战书 6点,您都可以通过电话接洽 我们 。
电话:400-996-1510
4.3上门技能 支持
对于疑难题目 ,我们的技能 工程师可以提供上门技能 支持,您可以事先通过电话举行 接洽 。
六 、公司简介
北京濡晖科技有限公司是国内专注互联网泄密防护的高科技企业,重要 从事互联网泄密举动 的研究和防护。公司核心 团队汇聚了具有多年网络安全、移动终端安全、移动通讯 、数据分析 、云盘算 、硬件安全芯片等丰富开辟 履历 与技能的专家级人才 ,形成了独有的核心 竞争力。
移动互联网期间 ,传统的泄密防护已经无法顺应 复杂网络环境 ,用户分散,移动装备 浩繁 的近况 ,我公司本着“安全成绩 空想 ”的理念,从业务模式入手,针对高校的业务特色研发了“1510系列安全产物 ” ,该体系 涵盖泄密变乱 发生的全过程,独创性的计划 了涉密字典、静默模式等功能,有效 地办理 了互联网环境 下涉密文档辨认 的题目 ,并可针对差别 应用场景的业务规范定制产物 流程,大幅进步 了互联网泄密防护的技能 保障本领 。
喜好 和支持该产物 请下面投票栏投票和转发!
【评比 报名】IT高管会-中国2017年度最佳互联网产物 奖评比 报名请发送产物 信息到:caocy@yeah.net!
【投融资项目征集】贸易 筹划 书请发送到IT高管会邮箱:caocy@yeah.net,内容包罗 :项目名称 、项目简介、行业分析、市场痛点 、功能先容 、团队先容 、竞争对手 、红利 方式、融资筹划 等。
-----------------
IT高管会:与一群浪漫而有头脑 的IT高管偕行 。
欢迎 与我们一同分享那些有代价 、故意 思的观点和事变 ,公众账号:ITGGH13