首页> 中国专利> 一种确定多核处理器中故障计算核的方法及电子设备

一种确定多核处理器中故障计算核的方法及电子设备

摘要

本申请涉及电子设备故障器件检测技术,具体涉及一种确定多核处理器中故障计算核的方法及电子设备。该方法应用于配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述方法包括:确定N次运行异常中各运行异常对应的计算核,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

著录项

  • 公开/公告号CN112527541A

    专利类型发明专利

  • 公开/公告日2021-03-19

    原文格式PDF

  • 申请/专利权人 华为技术有限公司;

    申请/专利号CN201910888839.6

  • 发明设计人 张志斌;张晓波;

    申请日2019-09-19

  • 分类号G06F11/07(20060101);

  • 代理机构11309 北京亿腾知识产权代理事务所(普通合伙);

  • 代理人陈霁

  • 地址 518129 广东省深圳市龙岗区坂田华为总部办公楼

  • 入库时间 2023-06-19 10:19:37

说明书

技术领域

本申请涉及电子设备故障器件检测技术,具体涉及一种确定多核处理器中故障计算核的方法及电子设备。

背景技术

根据统计,发生自动重启等运行异常的概率约为300/百万。若一年的出货量为2亿台的话,则发生自动重启等运行异常的手机约为6万部。

目前,手机已普遍采用集成了8个计算核(core)的处理器。尽管处理器是多核的,但该多核中任何一个核发生了可靠性故障,都会导致手机自动重启等运行异常。随着手机片上系统(system on chip,SOC)制程工艺不断演进,一枚处理器中集成的计算核核越来越多,相应地,对于手机而言,其发生计算核的可靠性故障的机率也越来越高。这必将严重影响用户体验,提高返修率和退机率。

手机的双倍数据率同步动态随机存取存储器(double data rate synchronousdynamic random access memory,DDR SDRAM)以及通用闪存存储(universal flashstorage,UFS)等器件发生故障时,往往也表现为自动重启等运行异常。这导致检测计算核故障的难度较大。目前,手机的维修网点尚无法检测计算核核故障,需要返厂进行检查。而返厂检测需要专门工具协助并反复压测做实验,并由专业人员人工分析才能定位自动重启等运行异常的原因。

发明内容

本申请实施例提供了一种确定故障计算核方法及电子设备,可以自动、快速确定出具体故障计算核。

第一方面,本申请实施例提供了一种确定多核处理器中故障计算核的方法,应用于配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述方法包括:确定N次运行异常中各运行异常对应的计算核,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

结合第一方面,在第一方面第一种可能的实现方式中,所述多核处理器为中央处理器或图形处理器。

在该实现方式中,可以确定故障CPU核,也可以确定故障GPU核。

结合第一方面,在第一方面第二种可能的实现方式中,所述动态调度策略为完全公平调度策略。

在该实现方式中,电子设备基于完全公平调度策略调度多核处理器中的计算核,可提高确定故障计算核的准确率。

结合第一方面,在第一方面第三种可能的实现方式中,所述对应于所述第一计算核的运行异常为连续发生的对应于所述第一计算核的运行异常。

在该实现方式中,通过判断某一计算核是否对应了连续发生的多次运行异常,来确定该计算核是否为故障核,可提高确定故障计算核的准确率。

结合第一方面,在第一方面第四种可能的实现方式中,所述对应于所述第一计算核的运行异常的次数等于N。

在该实现方式中,通过判断该电子设备已发生的多次运行异常是否对应于某一计算核,而确定该计算核为故障计算核,可提高故障计算核的准确率。

结合第一方面,在第一方面第五种可能的实现方式中,所述对应于所述第一计算核的运行异常为发生在预设期间内的对应于所述第一计算核的运行异常。

在该实现方式中,可以通过发生在预设期间内的运行异常来确定故障计算核,从而可以避免发生时间比较久远的运行异常对结果的影响。

结合第一方面,在第一方面第六种可能的实现方式中,所述方法还包括:屏蔽所述第一计算核。

在该实现方式中,在确定出故障计算核后,可以屏蔽该故障计算核,从而可避免在该故障计算核上运行程序指令而导致的异常运行,提高了用户体验。

结合第一方面,在第一方面第七种可能的实现方式中,所述运行异常为电子设备的异常重启。

在该实现方式中,通过异常重启这一故障计算核触发的运行异常中常见运行异常来确定故障计算核,可提高确定效率。

结合第一方面,在第一方面第八种可能的实现方式中,所述电子设备包括第一文件和第二文件;其中,所述第一文件记录有所述N次运行异常中各运行异常的发生时间和产生原因;所述第二文件记录有计算核的标识和运行异常的发生时间;所述确定N次运行异常中各运行异常对应的计算核包括:根据第一文件记录的运行异常的产生原因,从第一文件中确定所述N次运行异常;根据第一文件中记录的运行异常的发生时间和所述第二文件记录的运行异常的发生时间,从所述第二文件中确定所述N次运行异常中各运行异常对应的计算核。

在该实现方式中,通过第一文件记录运行异常的相关信息,通过第二文件记录运行异常对应的计算核信息,可通过运行异常的发生时间将运行异常和计算核信息关联,提高了确定故障计算核的效率。

结合第一方面,在第一方面第九种可能的实现方式中,所述故障计算核的信息记录在第三文件中,所述第三文件可被调用和/或发送给其他电子设备。

在该实现方式中,故障计算核的信息可以被记录的文件中,方便调用和发送给其他设备。

第二方面,本申请实施例提高了一种确定多核处理器中故障计算核的方法,应用于第一电子设备;所述方法包括:获取第二电子设备的日志文件;其中,所述第二电子设备配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述日志文件记录有所述第二电子设备的N次运行异常,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;确定所述N次运行异常中各运行异常对应的计算核;当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

在该方案中,电子设备可以获取其他电子设备的日志文件,并根据日志文件中记录的运行异常,确定该其他电子设备的故障计算核。

结合第二方面,在第二方面第一种可能的实现方式中,所述多核处理器为中央处理器或图形处理器。

结合第二方面,在第二方面第二种可能的实现方式中,所述动态调度策略为完全公平调度策略。

结合第二方面,在第二方面第三种可能的实现方式中,所述对应于所述第一计算核的运行异常为连续发生的对应于所述第一计算核的运行异常。

结合第二方面,在第二方面第四种可能的实现方式中,所述对应于所述第一计算核的运行异常的次数等于N。

结合第二方面,在第二方面第五种可能的实现方式中,所述对应于所述第一计算核的运行异常为发生在预设期间内的对应于所述第一计算核的运行异常。

结合第二方面,在第二方面第六种可能的实现方式中,所述方法还包括:向所述第二电子设备发送所述第一计算核的标识信息,以使所述第二电子设备屏蔽所述第一计算核。

结合第二方面,在第二方面第七种可能的实现方式中,所述运行异常为所述第二电子设备的异常重启。

结合第二方面,在第二方面第八种可能的实现方式中,所述日志文件包括第一文件和第二文件;其中,所述第一文件记录有所述N次运行异常中各运行异常的发生时间和产生原因;所述第二文件记录有计算核的标识和运行异常的发生时间;

所述确定所述N次运行异常中各运行异常对应的计算核包括:

根据第一文件记录的运行异常的产生原因,从第一文件中确定所述N次运行异常;

根据第一文件中记录的运行异常的发生时间和所述第二文件记录的运行异常的发生时间,从所述第二文件中确定所述N次运行异常中各运行异常对应的计算核。

第三方面,本申请实施例提供了一种确定多核处理器中故障计算核的装置,设置于配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述装置包括:

第一确定单元,用于确定N次运行异常中各运行异常对应的计算核,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;

第二确定单元,用于当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

第四方面,本申请实施例提供了一种确定多核处理器中故障计算核的装置,设置于第一电子设备;所述装置包括:

获取单元,用于获取第二电子设备的日志文件;其中,所述第二电子设备配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述日志文件记录有所述第二电子设备的N次运行异常,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;

第一确定单元,用于确定所述N次运行异常中各运行异常对应的计算核;

第二确定单元,用于当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

第五方面,本申请实施例提供了一种电子设备,包括至少一个处理器、存储器;所述至少一个处理器包括多核处理器,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;

所述存储器用于存储计算机执行指令,当所述电子设备运行时,所述至少一个处理器执行所述存储器存储的所述计算机执行指令,以使所述电子设备执行第一方面所述的方法。

第六方面,本申请实施例提供了一种电子设备,包括处理器、存储器、收发器;所述存储器用于存储计算机执行指令,当所述电子设备运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述电子设备执行第二方面所述的方法。

第七方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行第一方面所述的方法或第二方面所述的方法。

第七方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品包含的程序代码被电子设备中的处理器执行时,实现第一方面所述的方法或第二方面所述的方法。

本申请实施例提供的确定多核处理器中故障计算核的方法,可以在电子设备发生了多次与多核处理器的计算核执行程序指令时出现的异常相关的运行异常时,通过分析该运行异常对应的计算核,若在多次运行异常中,有达到预设数量的运行异常对应的计算核为同一个计算核,则可以确定该计算核为故障计算核,从而实现了在无需专业人员以及无需专门的测试的情况下,自动、快速确定故障计算核。

附图说明

图1为本申请实施例提供的一种电子设备的硬件结构示意图;

图2为本申请实施例提供的一种电子设备的软件结构框图;

图3为本申请实施例提供的一种确定多核处理器中故障计算核的方法的流程图;

图4为本申请实施例提供的一种确定多核处理器中故障计算核的方法的原理框图;

图5为本申请实施例提供的一种确定多核处理器中故障计算核的方法的流程图;

图6为本申请实施例提供的一种确定多核处理器中故障计算核的装置的示意性框图;

图7为本申请实施例提供的一种确定多核处理器中故障计算核的装置的示意性框图;

图8为本申请实施例提供的一种电子设备的示意性框图;

图9为本申请实施例提供的一种电子设备的示意性框图。

具体实施方式

下面将结合附图,对本申请实施例中的技术方案进行描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。

在本说明书的描述中“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。

其中,在本说明书的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“多个”是指两个或多于两个。

在本说明书的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。

本申请实施例提供了一种确定多核处理器中故障计算核的方法,在电子设备发生了多次与多核处理器的计算核执行程序指令时出现的异常相关的运行异常时,通过分析该运行异常对应的计算核,若在多次运行异常中,有达到预设数量的运行异常对应的计算核为同一个计算核,则可以确定该计算核为故障计算核。在本申请实施例中,故障计算核是指计算核本身具有故障。

本申请实施例提供的确定多核处理器中故障计算核核的方法可以应用于配置有多核处理器的电子设备。电子设备可以为手机、平板电脑、数码相机、个人数字助理(personal digitalassistant,PDA)、可穿戴设备、膝上型计算机(laptop)等便携式电子设备。便携式电子设备的示例性实施例包括但不限于搭载iOS、android、microsoft或者其他操作系统的便携式电子设备。上述便携式电子设备也可以是其他便携式电子设备,诸如具有触敏表面(例如触控面板)的膝上型计算机(laptop)等。还应当理解的是,在本申请其他一些实施例中,电子设备也可以不是便携式电子设备,而是具有触敏表面(例如触控面板)的台式计算机。本申请实施例对电子设备的类型不做具体限定。

图1示出了电子设备100的结构示意图。

电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。

可以理解的是,本申请实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。

处理器110可以包括中央处理器(central processing unit,CPU)。CPU可以集成有多个计算核,该多个计算核的各个核可以彼此独立。电子设备在运行时,可以将程序指令分配给CPU的一个或多个计算核,以执行该程序指令。

处理器110还可以包括图形处理器(graphics processing unit,GPU)。GPU可以集成多个计算核,该多个计算核的各个核可以彼此独立。电子设备在进行图形处理时,可以将图形处理相关的程序指令分配给GPU的一个或多个计算核,以执行该程序指令。

处理器110还可以调制解调处理器,图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。

控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。

处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。

在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。

I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。

I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。

PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。

UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。

MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。

GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。

USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。

可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。

充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。

电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。

电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。

天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。

移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(lownoise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。

调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给中央处理器。中央处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。

无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。

在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multipleaccess,CDMA),宽带码分多址(wideband code divisionmultipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),第五代,新空口(new radio,NR),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioningsystem,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidou navigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellite system,QZSS)和/或星基增强系统(satellite based augmentationsystems,SBAS)。

电子设备100通过GPU,显示屏194,以及中央处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和中央处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。

显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。

在本申请的一些实施例中,当显示面板采用OLED、AMOLED、FLED等材料时,显示屏194可以被弯折,即电子设备100可以配置有可折叠显示屏。这里,显示屏194可以被弯折是指显示屏可以在固定部位或者任意部位被弯折到任意角度,并可以在该角度保持。可折叠显示屏具有两种模式:展开状态和折叠状态。其中,可折叠显示屏弯折时形成的弯折角度大于预设值时可看作处于展开状态,可折叠显示屏弯折时形成的弯折角度小于预设值时可看作处于折叠状态。弯折角度可以是指可折叠屏不用于显示内容的一面在弯折部位形成的角度。预设值可以预先定义,例如可以为90度、80度等。在一些实施例中,可折叠显示屏的弯折位置处可以设置有角度传感器,电子设备可以通过该角度传感器检测该弯折角度,并可根据该弯折角度判断可折叠显示屏是处于展开状态或者折叠状态。

可折叠显示屏处于展开状态时,可以全屏显示电子设备的操作系统所提供的用户界面。全屏显示用户界面可以是指该用户界面占用可折叠显示屏的全部显示区域,也可以是指用户界面占用显示屏的大部分显示区域,例如当可折叠显示屏为异形切割屏(Notch屏)时,异形切割屏的中间部分显示该用户界面,一侧或两侧边缘部分黑屏时,也可看作该可折叠显示屏全屏显示该用户界面。

可折叠显示屏处于折叠状态时,电子设备可以仅在该可折叠显示屏的其中一个显示屏上显示操作系统所提供的用户界面,也可以在该可折叠显示屏的两个显示屏上都显示电子设备的操作系统提供的用户界面,本申请实施例不做限制。

在一些实施例中,当可折叠显示屏由展开状态变换为折叠状态时,电子设备可以从在可折叠显示屏上全屏显示用户界面变换为在该可折叠显示屏上的其中一个显示屏上显示该用户界面。

在本申请的另一些实施例中,电子设备100可以配置有两个独立的显示屏,两个显示屏分别位于电子设备100的两面。当电子设备100配置有两个显示屏时,该两个显示屏可以具有相同的配置,也可以具有不同的配置。例如,该两个显示屏可以采用相同或不同的材料,可以具有相同或不同的屏幕尺寸,比如,一个显示屏是6英寸的OLED屏幕,一个显示屏是3.3英寸的LCD屏幕,本申请实施例不做限制。

电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及中央处理器等实现拍摄功能。

ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。

摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。

数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。

视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。

NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。

外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。

内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行电子设备100的各种功能应用以及数据处理。

电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及中央处理器等实现音频功能。例如音乐播放,录音等。

音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。

扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。

受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。

麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。

耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。

压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。在一些实施例中,压力传感器180A可以检测到用户的手指接触显示屏194的检测信号而确定手指接触显示屏194的接触面积和接触区域,进而可以确定手指是否夹在折叠形态下的电子设备100之间。

陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。

气压传感器180C用于测量气压。在一些实施例中,电子设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。

磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当电子设备100是翻盖机时,电子设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。

加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。

距离传感器180F,用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备100可以利用距离传感器180F测距以实现快速对焦。

接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180G检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。

环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测电子设备100是否在口袋里,以防误触。

指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。

温度传感器180J用于检测温度。在一些实施例中,电子设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,电子设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备100对电池142加热,以避免低温导致电子设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。

触摸传感器180K,也称“触控器件”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给中央处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。

骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。中央处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。

按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。

马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。

指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。

SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。

电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明电子设备100的软件结构。

图2是本申请实施例的电子设备100的软件结构框图。

分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)库和系统库,以及内核层。

应用程序层可以包括一系列应用程序包。

如图2所示,应用程序包可以包括手机管家,通话,地图,即时通讯、相机等应用程序。

应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。

如图2所示,应用程序框架层可以包括内容提供器(content providers)、视图系统(view system)以及管理器(managers),其中,管理器包括活动管理器(activitymanager)、电话管理器(telephony manager)、通知管理器(notification manager)、资源管理器(resoure manager)、窗口管理器(window manager)等。

内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。

视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。

活动管理器用于管理应用程序的生命周期,及Activity栈管理等。

电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。

通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。

资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。

窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。

窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。

安卓运行时(Android Runtime)包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。

核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。

应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。

系统库可以包括故障计算核定位模块和其他功能模块。其中,其他功能模块可以包括表面管理器(surface manager),媒体库(media libraries),三维图形处理库(例如:OpenGL ES),二维图形引擎(例如:SGL)等。

故障计算核定位模块可以根据每次内核层记录的异常运行的信息和内核层记录的运行异常对应的计算核的信息,确定每次异常运行对应的计算核的信息。计算核可以为多核CPU或多核GPU的计算核。其中,当多核CPU或多核GPU中的任意一个计算核对应的运行异常的次数满足预设规则时,可确定该计算核为故障计算核。

表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。

媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。

三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。

二维图形引擎是二维绘图的绘图引擎。

内核层是硬件和软件之间的层。内核层至少包含日志管理模块,异常处理模块,处理器驱动,显示驱动,键映射驱动,摄像头驱动,音频驱动,闪存驱动,Wi-Fi驱动,蓝牙驱动,传感器驱动,电源管理器驱动等。

下面结合捕获拍照场景,示例性说明电子设备100软件以及硬件的工作流程。

当触摸传感器180K接收到触摸操作,相应的硬件中断被发给内核层。内核层将触摸操作加工成原始输入事件(包括触摸坐标,触摸操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件,识别该输入事件所对应的控件。以该触摸操作是触摸单击操作,该单击操作所对应的控件为相机应用图标的控件为例,相机应用调用应用框架层的接口,启动相机应用,进而通过调用内核层启动摄像头驱动,通过摄像头193捕获静态图像或视频。

内核层中的异常处理模块可在文件A中记录运行异常的信息,该运行异常可以包括内核层的运行异常。该运行异常的信息可以包括该运行异常的发生时间、发生原因等信息。在一个例子中,异常处理模块可以调用oops函数在文件A中记录运行异常的信息。日志管理模块可以在文件B中记录运行异常对应的计算核的信息,例如运行异常的发生时间、计算核的标识等。在一个例子中,日志管理模块可以调用printk函数在文件B中记录计算核的信息。系统库中的故障计算核定位模块可以读取文件A和文件B记录的信息。其中,从文件A中筛选出预设类型的运行异常(例如panic重启)以及该运行异常的时间。然后根据该运行异常的时间从文件B中确定该运行异常对应的核信息。若连续多次的预设类型的运行异常中的第一数量的运行异常对应的计算核为同一个计算核,可以确定该计算核为故障计算核(该计算核本身发生了故障)。故障计算核定位模块可以将该故障计算核的信息记录在文件C中。文件C可被应用层的应用程序访问,以及可被发送至其他电子设备(例如设备厂商的数据中心等)。

接下来,结合图3,对本申请实施例提供的确定多核处理中故障计算核的方法进行举例说明。该方法可应用于配置有多核处理器的电子设备。该多核处理器可集成有多个计算核(core)。计算核也可以称为处理核。该多个计算核之间相互独立,可并行执行程序指令。在电子设备运行时,电子设备可以利用动态调度策略将需要执行的程序指令分配给该多个计算核中的至少一个计算核,以执行程序指令。

动态调度策略也可以称为非静态分配策略,是指可避免一个或多个进程始终运行在多核处理器上的某一个计算核上的调度策略。

在一些实施例中,动态调度策略可以为基于内核层的多核处理器负载均衡调度算法。具体地,基于内核层的多核处理器负载均衡调度算法可以为完全公平调度策略(completely fair scheduler,CFS)。电子设备的内核层可以根据完全公平调度策略将需要执行的程序指令分配给多个计算核中的一个或多个,可实现随机分配,多个计算核中各计算核被分配到该程序指令的机率相等或大致相等。

在一些实施例中,动态调度策略可以为轮询策略。

在一些实施例中,该多核处理器可以为多核CPU。相应地,计算核为CPU核,也可称为CPU核心或CPU处理核心。

在一些实施例中,该多核处理器可以为多核GPU。相应地,计算核为GPU核,也可称为GPU核心或GPU处理核心。

如图3所示,该方法还包括如下步骤。

步骤301,确定N次运行异常中各运行异常对应的计算核,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致。

N可以为预设的整数,例如3、5、10等。

通常,计算核执行程序指令时出现的异常可包括如下情况:

计算核本身的故障,可导致其在执行程序指令时出现异常;

程序指令有漏洞(bug),当该程序指令被计算核执行时,可出现异常;

存储数据或指令的存储区域(例如DDR的分区)故障,当计算核执行程序指令,调用在故障存储区域上存储的数据或指令时,可出现异常。

计算核执行程序指令时出现的异常可导致电子设备的运行异常。通常该运行异常具体可以为异常重启、黑屏、冻屏等。其中,以异常重启最为常见。

在一些实施例中,计算核执行程序指令时出现的异常导致的电子设备的异常重启可以称为panic重启。

另外,电子设备摄像头出现异常、麦克风出现异常、电池的电流或电压出现异常等也可以导致电子设备的异常运行,例如异常重启。

电子设备可以记录发生的运行异常的相关信息,其中包括发生时间,以及该运行异常的发生原因。电子设备还可以记录运行异常对应的器件的信息,例如,若该运行异常是由计算核执行程序指令时出现的异常导致的,电子设备可以记录该计算核的信息。

在一些实施例中,发生时间可以为运行异常发生的时间。以运行异常为异常重启为例,若计算核执行程序指令时出现异常,内核层可调用系统重启流程进行重启。在执行重启之前,内核层可以调用oops函数在文件A中记录该重启的发生原因和该重启的发生时间,并保存文件A。文件A可以为文本文件。

电子设备可以将运行异常的发生时间和该运行异常对应的器件的信息,记录在一个文件B中,并保存文件B。器件的信息具体可以为器件的标识。文件B可以为文本文件。

在一个例子中,以运行异常为异常重启为例,若计算核执行程序指令时出现异常,内核层可调用系统重启流程进行重启。内核层可以在文件B记录该异常重启对应的计算核的标识以及异常重启的发生时间等信息。在一个例子中,内核层可以调用printk函数在文件B记录该异常重启对应的器件的标识以及异常重启的发生时间等信息。

在一个例子中,若运行异常的原因为摄像头出现的异常或麦克风出现的异常或电池的电流或电压出现的异常等时,记录在文件B中的运行异常对应的器件的信息可以包括出现异常的器件(摄像头或麦克风或电池等)的信息和异常出现时正在执行程序指令的计算核的信息。

在这些实施例的一个说明性示例中,文件A和文件B可以为不同的文件。文件A中可以记录了至少一次运行异常的相关信息,其中,各次运行异常的相关信息可以包括该运行异常的发生原因、发生时间等信息。文件B中可以记录了至少一次运行异常的发生时间和该至少一次运行异常对应的器件的信息,其中,各次运行异常对应的器件的信息可以包括器件的标识,例如计算核的编号。

在一个具体例子中,文件A的至少部分数据记录格式可如表1所示,文件B中的至少部分数据记录格式可如表2所示。

表1

在表1中,reason为运行异常的原因,time为运行异常的发生时间。reason中的AP为应用处理器(application processor)的缩写。应用处理器也可以称为CPU。该reason可表示运行异常的原因为应用处理器或CPU的计算核执行程序指令时出现异常。

表2

在表2中,time为运行重启的发生时间,data为多核CPU中的某一计算核的编号,该编号可以作为该计算核的标识。

在一些实施例中,文件A可以是一组文件,其中每一组文件中记录了一次运行异常的相关信息。文件A对应的一组文件可以进行压缩。

文件B可以是一组文件,其中每一组文件中记录了一次运行异常的发生时间,以及该次运行异常对应的器件的信息。文件B对应的一组文件可以进行压缩。

在一些实施例中,文件A或文件B也可以是其他形式的数据或日志或记录。

在一些实施例中,发生时间可以为导致该运行异常的原因发生时间。运行异常的原因具体可以为上述的计算核执行程序指令时出现的异常、摄像头出现的异常、麦克风出现的异常、电池的电流或电压出现的异常等。在运行异常的原因发生时,内核层可以调用oops函数在文件a中记录运行异常的原因、该原因的发生时间,并保存文件a。文件a可以参考上文对文件A的介绍,在此不再赘述。

电子设备可以将导致该运行异常的原因发生时间和该运行异常对应的器件的信息,记录在一个文件b中。内核层可以在文件b记录该运行对应的器件的标识以及运行异常的原因发生时间等信息,并保存文件b。文件b可以参考上文对文件B的介绍。

在一个例子中,若运行异常的原因为摄像头出现的异常或麦克风出现的异常或电池的电流或电压出现的异常等时,记录在文件b中的运行异常对应的器件的信息可以包括出现异常的器件(摄像头或麦克风或电池等)的信息和异常出现时正在执行程序指令的计算核的信息。

在步骤301中,电子设备可以根据运行异常的原因,确定多个由计算核执行程序指令时出现的异常导致的运行异常。并确定该多个运行异常中各运行异常对应的计算核。

在一些实施例中,步骤301可以在运行异常结束后执行。以异常重启为例,步骤301可以在电子设备完成重启后执行。

在一些实施例中,可根据运行异常的原因,从文件A中确定多个由计算核执行程序指令时出现的异常导致的运行异常。然后,根据运行异常的发生时间,从文件B中,确定该多个运行异常中各运行异常对应的计算核。对于该多个运行异常中的任意运行异常,其发生时间在文件A和文件B都有记录,并且文件B记录了计算核的信息。因此,可根据该运行异常的发生时间,确定该运行异常对应的计算核。

在一些实施例中,可根据运行异常的原因,从文件a中确定多个由计算核执行程序指令时出现的异常导致的运行异常。然后,根据运行异常的发生时间,从文件b中,确定该多个运行异常中各运行异常对应的计算核。对于该多个运行异常中的任意运行异常,其原因的发生时间在文件a和文件b都有记录,并且文件b记录了计算核的信息。因此,可根据该运行异常的原因的发生时间,确定该运行异常对应的计算核。

在一些实施例中,确定的多个由计算核执行程序指令时出现的异常导致的运行异常可以为连续发生的运行异常。以异常重启为例,确定的多个异常重启为连续发生的异常重启。

在一些实施例中,确定的多个由计算核执行程序指令时出现的异常导致的运行异常可以为发生在预设期间内的运行异常。该预设期间可以为以当前时刻起点,在时间维度上,向前计算预设时长的期间,例如最近7天或10天或3天等。

步骤303,当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

容易理解,内核层基于动态调度策略为多核处理器中的各个分配程序指令,某一程序指令非始终运行在某一个计算核上,并且DDR等存储器的一个或多个分区上的数据或指令也非始终由某一个计算核调用。若N次运行异常中的较多或全部的运行异常是由第一计算核运行程序指令时出现的异常导致的,则可表明或反映出现的异常大概率是第一计算核本身的故障造成的。

M可以根据N的值预先设定的整数。M可以等于或小于N,例如N为3,M可以为3。再例如N为5,M可以为4。再例如N为10,M可以为8。等等,此处不再一一列举。开发人员可以根据相关指标来设定N和M的值。例如为了降低误判率,可以将N和M设置的高些。再例如,为了快速确定故障计算核,可以将N和M设置的低些。

在一些实施例中,对应于所述第一计算核的运行异常可以为连续发生的对应于所述第一计算核的运行异常。

在这些实施例的一个说明性示例中,可以设定以为2。以集成了8个计算核的处理器为例,在动态调度策略下,某个具有漏洞的程序指令连续2次由8个计算核中的任一个计算核运行的概率为

在这些实施例的一个说明性示例中,可以设定M为3。仍以集成了8个计算核的处理器为例,在动态调度策略下,误判率不大于

在一些实施例中,所述对应于所述第一计算核的运行异常的次数等于N。

在这些实施例的一个说明性示例中,可以设定N为3,则误判率不大于1.6%。

在实际实验中,按照该示例的设定,确定故障核的准确率也超过了95%。

在一些实施例中,N>M,且所述对应于所述第一计算核的运行异常的次数为M。

在这些实施例的一个说明性示例中,可以设定N为10,M为9。仍以集成了8个计算和的处理器为例,则误报率已接近于0了。

在一些实施例中,所述对应于所述第一计算核的运行异常为发生在预设期间内对应于所述第一计算核的的运行异常。

该预设期间可以为以当前时刻起点,在时间维度上,向前计算预设时长的期间,例如最近7天或10天或3天等。以避免较久远的异常运行的干扰。

在一些实施例中,步骤303可被一些等效判断方法代替。

在一个说明性示例中,可代替步骤303的等效判断方法可以为:在预设时间内发生的多次运行异常中,对应于所述第一计算核的异常的次数≥K。该预设时间可以为以当前时刻起点,在时间维度上,向前计算预设时长的期间(例如最近7天或10天或3天等)。K为预设值(例如可以为3、5、6等)。

在一个说明性示例中,可代替步骤303的等效判断方法可以为:在预设时间内发生的多次运行异常中,对应于所述第一计算核的异常的比例≥Z%。该预设时间可以为以当前时刻起点,在时间维度上,向前计算预设时长的期间(例如最近7天或10天或3天等)。Z%为预设值(例如可以为70%、80%、90%等)。

在一些实施例中,在确定出故障计算核时,可以屏蔽该故障计算核,使得内核层在分配程序指令时可以忽略该故障计算核,从而可避免该故障计算核导致的运行异常。

在一个说明性示例中,可调用内核层处理器驱动可以使用echo命令禁止或停用该故障计算核。禁止或停用该故障计算核可以称为屏蔽该故障计算核。在一个具体例子中,该echo命令可以为echo 0>/sys/devices/system/cpu/cpu3/online。其中,cpu3表示编号为3的CPU核。

在一些实施例中,在确定出故障计算核时,可以将该故障计算核的信息,例如计算核的标识等,记录在文件C中,并保存文件C。文件C可以参考上文对文件A的介绍,在此不再赘述。

在一个说明性示例中,应用层的应用,例如手机管家等可以通过API接口读取文件C,以读取故障计算核的信息。该应用读取了故障计算核的信息,可以展示该故障计算核,以使用户或维修人员明白出故障的计算核。

在该示例的一个例子中,每当文件C记录了故障计算核的信息时,可以通知应用层的应用,以使该应用进行读取。

在一个说明性示例中,电子设备还可以将文件C发送给其他电子设备,例如发送给设备厂商的数据中心服务器,以使设备厂商进行相关统计。在一个具体例子中,将文件C发送给其他电子设备可以为响应于用户起始的操作而执行的操作,即用户可以主动将文件C发送给其他电子设备。在一个具体例子中,电子设备可以请求用户的授权,在获得用户授权的情况下,将文件C发送给其他电子设备。具体地,电子设备可以在显示屏上显示授权请求信息,其中包括风险提示信息、拒绝功能选项和同意功能选项。在检测到用户点击或触摸同意功能选项后,可将文件C发送给其他电子设备。

在一个说明性示例中,每当文件C记录了故障计算核的信息时,可以通知设备厂商的数据中心服务器,以使该数据中心服务器读取文件C中的故障计算核信息。

在一些实施例中,图3所述的方法具体可以由系统库(也可称为原生(native)层)中的故障计算核定位模块执行。

在一个说明性示例中,该故障计算核定位模块可以为原生层的应用程序。该故障计算核定位模块可以C语言或C++语言编写。该故障计算核定位模块可以读取文件A,确定由计算核执行程序指令时出现的异常导致的运行异常,以及运行异常的发生时间。该故障计算核定位模块还可以读取文件B中记录的运行异常的发生时间和运行异常对应的cpu核信息。故障计算核定位模块可以通过任意的运行异常的发生时间,确定该运行异常对应的cpu核信息。从而可确定各运行异常对应的cpu核。

内核层可以包括日志管理模块、异常处理oops函数、CPU驱动等。

异常处理函数oops可以电子设备的异常重启记录到文件A,日志管理模块调用printk函数记录该异常重启对应的cpu核信息(包括cpu核标识)到文件B。文件A的格式如下表1所示,关键信息是reason、time。文件B的格式如表2所示,关键信息是Time,Data。

在一个具体例子中。1)当电子设备的软件代码运行到故障cpu核时,发生异常,导致软件代码访问的数据/指令地址非法,触发异常处理oops函数记录异常重启事件到文件A,以及触发日志管理模块调用printk函数将该异常重启事件对应的核信息和发生事件记录到文件B。接着内核层调用系统重启流程主动重启电子设备。在发生第1次系统异常重启后,故障计算核定位模块通过读取文件A,采集到异常重启事件,记录该异常重启事件的发生时间,同时基于该异常重启事件的发生时间,读取文件B中记录的cpu核的标识,例如cpu核的标识可以为编号,更具体的,可以为编号3。

2)重复步骤2),直到发生第3次异常重启后,故障计算核定位模块计算第3次异常重启和第1次异常重启发生的时间间隔在7天之内,同时第3次异常重启发生后,读取文件B中记录的cpu核编号为3,和前面2次一样,则判断是编号为3的cpu核故障,将结果写入到文件C,通知java层的应用或者大数据网站的数据库去读取。java层的应用可以为手机管家等第三方提供的系统管理应用程序。大数据网站可以为设备厂商的数据中心。在接收到大数据网站的数据库发送的读取请求时,电子设备可以请求用户的授权,在得到用户授权后,可允许大数据网站的数据库读取文件C。

3)可调用cpu驱动模块提供的echo命令去关闭编号为3的cpu核(即屏蔽编号为3的cpu核),禁止编号为3的cpu核运行。

通过本示例中的方案,在实际实验中,通过内核系统重启故障类型的定位算法,可以准确定位出cpu核的故障。从抽样回来的故障机验证效果看,准确率达到95%以上,实现了出现该故障就可以自动定位和精准维修,无需再压测分析。

本申请实施例提供的确定多核处理器中故障计算核的方法,可以在电子设备发生了多次与多核处理器的计算核执行程序指令时出现的异常相关的运行异常时,通过分析该运行异常对应的计算核,若在多次运行异常中,有达到预设数量的运行异常对应的计算核为同一个计算核,则可以确定该计算核为故障计算核,从而实现了在无需专业人员以及无需专门的测试的情况下,自动、快速确定故障计算核。

接下来,结合图4,在一些实施例中,对本申请实施例提供的确定多核处理器中故障计算核的方法的实现原理进行举例介绍。

如图4所示,电子设备的软件框架可以包括java应用层、native应用层和内核层。

java应用层可包括java应用程序,例如网点维修apk应用。

Native应用层包括native应用程序。native应用程序可以用C语言或C++语言编写。Native应用程序可以进行重启信息收集,并利用重启定位算法,定位重启是CPU核故障导致的,并记录到文本文件,以及通知java应用程序或大数据网站数据库读取。具体地,Native应用程序读取文本文件A和文本文件B,采集重启故障和对应的cpu核信息,通过Native应用程序的重启定位算法,定位出是cpu核故障,记录到文本文件C中。接着通过内核cpu驱动模块的echo命令去禁止出故障的cpu核,保障用户的稳定性体验。或者Native应用程序把cpu核故障结果文本文件上报给网点维修工具(即网点维修apk应用),提供准确的维修方案。或者把cpu核故障结果文本文件上报大数据网站解析,提供给研发人员定位原因。

内核层可以包括日志管理模块、异常处理函数oops、CPU驱动等。

本实施例的方案中,关键之处在于重启定位算法,其将重启故障类型和CPU核信息通过经验值关联起来。具体如下。

1)内核异常处理函数oops记录系统异常重启到文本文件A,内核日志管理模块调用printk函数记录cpu核信息到文本文件B。文本文件A的格式如下表1所示,关键信息是reason、time。文本文件B的格式如表2所示,关键信息是Time,Data。

2)当设备的软件代码运行到故障cpu核发生故障,导致软件代码访问的数据/指令地址非法,触发内核调用oops函数记录异常重启事件到文本文件A,接着内核调用系统重启流程主动重启设备。在发生第1次系统异常重启后,Native层应用程序通过读取文本文件A,采集到异常重启事件,记录重启发生的时间,同时读取文本文件B中记录的cpu核编号为3

3)重复步骤2),直到发生第3次系统异常重启后,Native层应用程序计算第3次异常重启和第1次异常重启发生的时间间隔在7天之内,同时第3次异常重启发生后,读取文本文件B中记录的cpu核编号为3,和前面2次一样,则判断是cpu3故障,将结果写入到文本文件C,通知java应用或者大数据网站的数据库去读取。

4)调用内核cpu驱动模块提供的echo命令去关闭cpu3,禁止cpu3运行。

需要说明的是,定位故障CPU核可有如下前提条件,以获得较为准确的结果:

1)基于内核层的多核系统负载均衡调度算法,例如完全公平调度策略(completely fair scheduler,CFS),不会出现某个进程固定跑在某个cpu核上的情况。

2)片上系统(system on chip,SOC)包括的Cpu核的数目至少8个,保证在非故障情况下,随机连续3次出现同一个核的概率,即误报率不大于(cpu核的数目/cpu核的数目的3次方),即8/512,即1.6%。

本实施例的方案采集内核系统重启这种故障类型,和cpu核信息进行经验值关联,可以准确定位出cpu核故障。通过本实施例的方案,自动禁核保障用户稳定性体验;并且记录故障CPU核的文件可以提供给网点维修工具,以便进行精准维修;以及记录故障CPU核的文件可以上报给大数据网站,以便研发分析。

本申请实施例提供了一种确定多核处理器中故障计算核的方法,可由第一电子设备执行。第一电子设备可以为任何具有计算、处理能力的装置、设备、平台、设备集群。在一个例子中,第一电子设备可以为位于手机等终端维修网点的电子设备。在另一个例子中,第一电子设备可以为手机等终端的生产厂商的电子设备。在另一个例子中,第一电子设备可以为用户可使用的电子设备。

参阅图5,该方法包括如下步骤。

步骤501,获取第二电子设备的日志文件;其中,所述第二电子设备配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述第二电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述日志文件记录有所述第二电子设备的N次运行异常,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致。

第二电子设备可以参考图1所示的电子设备100的介绍。第二电子设备的运行时,向多个计算核分配程序指令的方式,以及计算核对程序指令的执行等,可以参考上文对图3所示实施例的介绍。

在一些实施例中,在第一电子设备获取第二电子设备之前,可以建立网络连接,以便第二电子设备将日志文件发送给第一电子设备。例如通过蓝牙等方式建立连接。

在一些实施例中,在第一电子设备获取第二电子设备之前,可以通过数据线连接,以便第二电子设备将日志文件发送给第一电子设备。例如通过USB数据线等建立连接。

在一些实施例中,第一电子设备可以为第二电子设备对应的服务端设备。例如,第一电子设备可以为第二电子设备生产厂商的为第二电子设备提供云端服务的设备。

在一些实施例中,第二电子设备可以向第一电子设备发送日志文件。

在一个说明性示例中,第一电子设备可以请求用户的授权,在获得用户授权的情况下,将日志文件发送给第二电子设备。具体地,电子设备可以在显示屏上显示授权请求信息,其中包括风险提示信息、拒绝功能选项和同意功能选项。在检测到用户点击或触摸同意功能选项后,可将日志文件发送给其他电子设备。

步骤503,确定所述N次运行异常中各运行异常对应的计算核。

步骤503可以参考上文对步骤301的介绍,在此不再赘述。

步骤505,当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

步骤505可以参考上文对步骤303的介绍,在此不再赘述。

在一些实施例中,所述多核处理器为中央处理器或图形处理器。

在一些实施例中,所述动态调度策略为完全公平调度策略。

在一些实施例中,所述对应于所述第一计算核的运行异常为连续发生的对应于所述第一计算核的运行异常。具体可以参考上文对步骤303的介绍,在此不再赘述。

在一些实施例中,所述对应于所述第一计算核的运行异常的次数等于N。具体可以参考上文对步骤303的介绍,在此不再赘述。

在一些实施例中,所述对应于所述第一计算核的运行异常为发生在预设期间内的对应于所述第一计算核的运行异常。具体可以参考上文对步骤303的介绍,在此不再赘述。

在一些实施例中,所述方法还包括:向所述第二电子设备发送所述第一计算核的标识信息,以使所述第二电子设备屏蔽所述第一计算核。

第一电子设备在确定出故障计算核后,可以向第二电子设备发送该故障计算核的标识信息。第二电子设备可以根据标识信息识别故障计算核,并屏蔽该故障计算核。具体可以参考上文对步骤303的介绍,在此不再赘述。

在一些实施例中,所述运行异常为所述第二电子设备的异常重启。

在一些实施例中,所述日志文件包括第一文件和第二文件;其中,所述第一文件记录有所述N次运行异常中各运行异常的发生时间和产生原因;所述第二文件记录有计算核的标识和运行异常的发生时间;第一文件和第二文件可以参考上文对文件A(或文件a)和文件B(或文件b)的介绍。

所述确定所述N次运行异常中各运行异常对应的计算核包括:根据第一文件记录的运行异常的产生原因,从第一文件中确定所述N次运行异常;根据第一文件中记录的运行异常的发生时间和所述第二文件记录的运行异常的发生时间,从所述第二文件中确定所述N次运行异常中各运行异常对应的计算核。具体可以参考上文对步骤303的介绍,在此不再赘述。

本申请实施例提供的确定多核处理器中故障计算核的方法,可以获取其他电子设备的日志文件,并根据该日志文件中记录的运行异常确定该其他电子设备的故障核,从而实现了在无需专业人员以及无需专门的测试的情况下,自动、快速确定故障计算核。

本申请实施例提供了一种确定多核处理器中故障计算核的装置600。该装置600可设置于配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的。

参阅6,所述装置600包括:

第一确定单元610,用于确定N次运行异常中各运行异常对应的计算核,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;

第二确定单元620,用于当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

上文主要从方法流程的角度对本申请实施例提供的装置600进行了介绍。可以理解的是,各个电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据图3所示的各方法实施例对电子设备等进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

本申请实施例提供的装置,可以在电子设备发生了多次与多核处理器的计算核执行程序指令时出现的异常相关的运行异常时,通过分析该运行异常对应的计算核,若在多次运行异常中,有达到预设数量的运行异常对应的计算核为同一个计算核,则可以确定该计算核为故障计算核,从而实现了在无需专业人员以及无需专门的测试的情况下,自动、快速确定故障计算核。

本申请实施例提供了一种确定多核处理器中故障计算核的装置700。该装置700可设置于第一电子设备。参阅图7,所述装置700包括:

获取单元710,用于获取第二电子设备的日志文件;其中,所述第二电子设备配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述第二电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述日志文件记录有所述第二电子设备的N次运行异常,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;

第一确定单元720,用于确定所述N次运行异常中各运行异常对应的计算核;

第二确定单元730,用于当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

上文主要从方法流程的角度对本申请实施例提供的装置700进行了介绍。可以理解的是,各个电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据图5所示的各方法实施例对电子设备等进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

本申请实施例提供的装置,可以获取其他电子设备的日志文件,并根据该日志文件中记录的运行异常确定该其他电子设备的故障核,从而实现了在无需专业人员以及无需专门的测试的情况下,自动、快速确定故障计算核。

本申请实施例提供了一种电子设备。参阅图8,该电子设备可以包括至少一个处理器810、存储器820。所述至少一个处理器810包括多核处理器。所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的。

所述存储器820用于存储计算机执行指令;当所述电子设备运行时,所述至少一个处理器810执行所述存储器820存储的所述计算机执行指令,以使所述电子设备执行图3所示的方法。其中,所述至少一个处理器810用于确定N次运行异常中各运行异常对应的计算核,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;所述至少一个处理器810还用于当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

在一些实施例中,该电子设备还包括通信总线830,其中,所述至少一个处理器810可通过通信总线830与存储器820,从而可获取存储器820存储的计算机执行指令,并执行该计算机执行指令。

本申请实施例的电子设备端各个部件/器件的具体实施方式,可参照上文如图3所示的各方法实施例实现,此处不再赘述。

由此,可以在电子设备发生了多次与多核处理器的计算核执行程序指令时出现的异常相关的运行异常时,通过分析该运行异常对应的计算核,若在多次运行异常中,有达到预设数量的运行异常对应的计算核为同一个计算核,则可以确定该计算核为故障计算核,从而实现了在无需专业人员以及无需专门的测试的情况下,自动、快速确定故障计算核。

本申请实施例提供了一种电子设备。参阅图9,该电子设备可以包括处理器910、存储器920。所述存储器920用于存储计算机执行指令;当所述电子设备运行时,所述处理器910执行所述存储器920存储的所述计算机执行指令,以使所述电子设备执行图5所示的方法。其中,所述处理器910用于获取第二电子设备的日志文件;其中,所述第二电子设备配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述第二电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述日志文件记录有所述第二电子设备的N次运行异常,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;所述处理器910还用于确定所述N次运行异常中各运行异常对应的计算核;所述处理器910还用于当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

在一些实施例中,该电子设备还包括通信总线930,其中,处理器910可通过通信总线930与存储器920,从而可获取存储器920存储的计算机执行指令,并执行该计算机执行指令。

本申请实施例的电子设备端各个部件/器件的具体实施方式,可参照上文如图5所示的各方法实施例实现,此处不再赘述。

由此,可以获取其他电子设备的日志文件,并根据该日志文件中记录的运行异常确定该其他电子设备的故障核,从而实现了在无需专业人员以及无需专门的测试的情况下,自动、快速确定故障计算核。

本申请的实施例中的方法步骤可以通过硬件的方式来实现,也可以由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于随机存取存储器(random access memory,RAM)、闪存、只读存储器(read-only memory,ROM)、可编程只读存储器(programmable rom,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。

可以理解的是,在本申请的实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本申请的实施例的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号