当前位置: 首页 > 质量专栏 > 为有效的测试数据生成和管理生成人工智能
为有效的测试数据生成和管理生成人工智能
2023-07-14 浏览次数936

  想象一下,一个画家正准备创作一部杰作,却被有限的调色板卡住了。他们能创造出美好的东西吗?完全正确!这与软件测试的世界非常相似,在那里我们无法访问到多样化和丰富的测试数据。幸运的是,生成型人工智能可以在这个场景中改变游戏规则。

  创造性人工智能的作品很像一个艺术学生,他观察,吸收,然后重新创作能够与经验丰富的画家作品竞争的绘画作品。这个AI学习输入数据中的模式,然后生成镜像这些模式的新数据。额外的好处是,可以对其进行培训,防止其违反任何可能妨碍使用原始数据的治理、隐私、安全或道德规范。

  一、理解生成人工智能和合成数据

  人工智能的一个子集,生成人工智能就像一个创造性的学徒。它学习输入数据中的模式,然后生成与这些模式相呼应的新数据。生成和制作合成数据是为了密切反映原始数据的特性。

  1、利用生成人工智能进行欺诈侦查:一个用例

  想象阿尔法公司。,一家金融机构,正在开发一个欺诈侦查系统--一个训练有素的机器学习模式,以区分欺诈和合法交易。为了有效地培训这个模型,它们需要一个足以代表这两种类型的事务的庞大而多样的数据集。

  2、真实数据方面的挑战

  实际上,欺诈性交易就像大海捞针一样--很少有。因此,生成具有大量欺诈性交易的真实世界数据集是很棘手的。治理和道德约束可能会进一步复杂化,并限制用于培训该模式的现有数据。

  因此,对这样一个数据集的模型进行培训可能会产生一个善于预测合法交易但无法识别欺诈交易的系统。这种偏向多数类别(合法交易)的做法是一个被称为"类别不平衡"的常见问题。"

  3、生成人工智能来营救

  这里是生成人工智能可以介入的地方。假设在一百万个交易数据集中,只有1000个是欺诈性的。可以对生成性AI模型进行关于该数据集的培训,以识别欺诈交易和合法交易的特征。

  一旦经过适当的训练,模型可以大量生成与实际交易非常相似的合成事务。生成性人工智能的一个突出特点是,它可以被指示生成特定比率的数据。在这里,人工智能可以生成具有欺诈性和非欺诈性交易的数据集。这个新的合成数据集以欺诈性交易丰富了内容,密切反映了现实世界中的情况。

  欺诈侦查系统在接受关于这一数据集的培训后,不太可能有偏见,更有能力识别欺诈交易和非欺诈交易,因为数据集是平衡的。

  4、现实世界的影响

  通过使用生成人工智能创建一个平衡的数据集,阿尔法公司。可以建立一个更有效的欺诈侦查系统.一个表现较好的系统可以通过抓住欺诈性交易来挽救数以百万计的机构,否则这些交易可能会从裂缝中溜走。此外,它可以提高客户的信任和满意度。通过遏制此类事件,该机构可以保持其客户的信任和忠诚。

  此外,使用合成数据可以在不损害客户隐私或违反数据保护条例的情况下进行严格的测试和开发。这可以使该机构避免潜在的法律问题和声誉损害。

  从本质上讲,生成性人工智能的应用不仅提高了该机构欺诈侦查系统的技术能力,而且大大提高了其业务目标和客户关系。

  二、为简化测试数据管理生成人工智能

  想象一下,试图维护一个巨大的、混乱的库--这就是管理大量测试数据的感觉。生成的AI提供了一个更聪明的解决方案;它可以在我们需要时生成测试数据,减少了对广泛存储的需求,并确保数据总是新鲜的。

  在连续测试环境中,每天使用静态测试数据运行多个测试,可能会由于数据过时而导致测试无效。然而,使用生成的AI,测试团队可以为每次测试生成一套新的数据集,确保涵盖各种不同的场景。

  1、一个真实的例子:电子商务测试

  想想全球知名的电子商务公司阿尔法公司。,负责管理一个复杂的网站,为全球数百万客户服务。该平台拥有过多的功能,包括产品浏览、客户评论、购物车管理以及复杂的结账和付款处理。为了确保顺利运作阿尔法公司。采用连续测试,以迅速发现和解决问题。

  阿尔法公司的测试小组。每天运行许多测试来验证系统的功能、性能和安全性。为了使这些测试有效,它们需要能够模拟真实世界客户互动的多样化和更新的数据。

  2、传统模式下的挑战

  在传统的设置中,测试团队将使用从生产数据复制的静态数据集。然而,这一方法有两个主要问题:

  数据陈旧性 :随着市场动态和客户行为的不断变化,静态数据很快就会过时,导致测试效率下降。

  存储问题 :保存一个大型静态测试数据集,与生产数据的多样性和数量相匹配,需要大量的存储和持续管理,增加了复杂性和成本。

  3、生成人工智能来营救

  不过,阿尔法公司。为了应对这些挑战,生成性人工智能已被纳入测试过程。在每次测试运行之前,生成的AI模型经过生产数据模式的训练,创建了一套与实际数据非常相似的新的合成数据集。

  例如,在测试支付处理系统时,生成型AI模型生成不同类型信用卡、购买金额、用户位置和交易时间的综合数据,模拟当前的客户交易行为。

  4、现实世界的影响

  数据的新鲜度确保它反映了客户行为的最新趋势和模式,从而导致更有效和相关的测试。由于合成数据是按需生成的,可在测试后丢弃,因此大量存储和数据管理基础设施的需要大大减少。

  通过将生成的人工智能集成到测试数据管理中,阿尔法公司。确保了更有效和高效的连续测试,从而提高了系统的可靠性和客户体验。

  三、挑战和考虑

  采用生成性人工智能会带来一系列挑战。人工智能训练的数据质量最终会影响输出的质量。除非我们了解用于培训数据生成的AI模型的数据源,否则总是会对所创建数据的质量提出疑问。此外,使用生成的AIS生成测试数据需要大量的计算资源,这对所有组织来说可能并不可行。

  在道德方面,即使合成数据不包含任何敏感信息,但确保它不会意外泄露培训数据中有关个人的任何信息是至关重要的。负责任地应对这些挑战是关键。

  生成人工智能设计是为了改变软件测试的环境.通过使我们能够创建多样化和现实的合成数据,它预示着一个软件测试的新时代--一个更加高效、全面和适应性更强的时代。

  四、展望未来

  生成人工智能的未来令人兴奋。这项技术的进步有可能重塑当前的工作流和实践。各组织必须不断更新并随时准备进行调整。

  虽然集成生成人工智能的道路可能会遇到困难,但更有效、更全面和更适应的软件测试的潜在回报使它成为值得一游的旅程。让我们负责任地走这条道路,拥抱生成人工智能提供的充满希望的未来。

        卓码软件测评是一家[ 具备CMA、CNAS双重资质 ]的专业做软件测试的第三方软件测试服务机构, 可根据您的需求提供各类软件测试服务,并出具合格有效的软件测试报告。点击→→可了解测试报价

        部分文字、图片来自网络,如涉及侵权,请及时与我们联系,我们会在第一时间删除或处理侵权内容。负责人:曾菲       电话:4006070568


文章标签: 软件测评 软件测试
咨询软件测试