如何计算所收集到的数据
大型强子对撞机探测器每年将收集到1500万GB的数据。因此科学家有巨大的数据处理任务。那么如何处理这么多的数据呢?如何知道这么多数据中有意义重大的数据呢?这得靠超级计算机处理才行。即使超级计算机处理这么多数据也需要数千小时。与此同时,大型强子对撞机还将继续源源不断地产生更多的数据。
欧洲核子研究组织解决此问题的办法就是LHC计算网格。 此网格是一个计算机网络,每一台计算机能各自分析大量的数据。一旦计算机完成其自己的分析工作,就会将其发现发送到中心计算机,从而再接受新数据进行分析。只要科学家能将数据分成不同的块,此系统就能很好地工作。在计算机行业,这叫“网格计算”。
| |
苏格兰物理学家彼得·希格斯(Peter Higgs) |
欧洲核子研究组织的科学家决定了集中利用相对便宜的设备完成他们的计算工作,而不准备购买前沿的数据服务器和处理器。此办法类似于Google所采用的策略。通过利用所谓中间件的特种软件,此计算机网络能贮存和分析大型强子对撞机每一次实验所产生的大量数据。此系统结构组织布局如下:0排是欧洲核子研究组织的计算机系统,将最先处理数据信息,并将它分成不同的块,供其它排的计算机处理。1排的12台计算机位于几个国家,将通过专用计算机联接来接受来自欧洲核子研究组织的数据。这些计算机联接能以每秒10GB的速度传输数据。1排的计算机将进一步处理数据,再将它分块,发送给下面一排的计算机。
2排100多台计算机将与1排的计算机相连。其中大多数计算机是大学和科研所的计算机,每一处地方将有多台计算机投入使用,用于处理和分析数据。当每一项处理工作完成,这些地方就会将分析结果返回给前排的计算机系统。1排和2排的连接是标准的网络连接。任何2排的计算机都能访问1排的计算机,从而让大学和科研所有机会能重点获取特别的数据信息,进行特定的研究。
如此大计算机网络的一大挑战就是数据安全。欧洲核子研究组织决定不给它装防火墙,因为这会造成此系统出现大量的数据阻塞。相反,此系统则通过身份识别和认可手续来防止未经认可的非法入侵。一些人认为数据安全的担忧是一个尚在争论中的论点,因为他们认为大型强子对撞机会最终毁灭整个世界。